Я все еще ищу помощь, но я нашел подход, который помогает частично (это не мое решение, но может кому-то помочь).
Я использую библиотеки xhtml2pdf и Pandas. Я получаю содержимое xls (x) с помощью Pandas, затем экспортирую файл в HTML и, наконец, создаю из него PDF-файл.
Основная проблема - структура, я потерял макет, цвета , шрифты, все прелестно, но я сохранил значения из ячеек.
from xhtml2pdf import pisa
import pandas as pd
xl = pd.ExcelFile("myExcelFile.xlsx")
df = xl.parse("sheet_name")
# Some cleaning
df.dropna(how="all") # If the row is completely NaN
df.dropna(how="all", axis="columns") # If the column is completely NaN
df.fillna("") # I delete the NaN values (just for beautify)
df.to_html('htmlFile.html', border=0)
with open("htmlFile.html", "r") as htmlFile:
with open("pdfFile.pdf", "w+b") as resultFile:
pisaStatus = pisa.CreatePDF(htmlFile, dest=resultFile)