Python добавление нескольких листов Excel в один PDF-файл - PullRequest
0 голосов
/ 10 июля 2020

Я использую Ubuntu 16.0.4. После чтения из файла Excel я пытаюсь добавить несколько листов Excel в файл PDF.

df = pd.read_excel(excel_name, sheet_name = 'Sheet1')
df = df.dropna(axis = 1, how='all')
df = df.dropna(how='all')
df.to_html("file.html")

pdf_name = name_of_file + '.pdf'
pdfkit.from_file("file.html", pdf_name)

Как я могу добавить еще один лист Excel из того же файла Excel в тот же файл PDF, не перезаписывая предыдущий лист что в pdf?

Спасибо!

1 Ответ

0 голосов
/ 10 июля 2020

Если два листа имеют одинаковую структуру данных (столбцы и c.):

df1 = pd.read_excel(excel_name, sheet_name = 'Sheet1')
df2 = pd.read_excel(excel_name, sheet_name = 'Sheet2')

df = df1.append(df2)

Если нет:

df1 = pd.read_excel(excel_name, sheet_name = 'Sheet1')
df2 = pd.read_excel(excel_name, sheet_name = 'Sheet2')

# Do whatever you need to transform the dfs

html_str = '<br />'.join([df1.to_html(), df2.to_html()])

with open("file.html", "w") as text_file:
    text_file.write(html_str)

pdf_name = name_of_file + '.pdf'
pdfkit.from_file("file.html", pdf_name)
...