Я использую python-pdfkit
для создания PDF-файла следующим образом:
pdfkit.from_file(list_of_files, toc=toc, cover=cover, cover_first=True, options=default_options)
Моя проблема связана с созданным оглавлением:
Оглавление генерируется на основе тегов H во входных данных.
документы
Если мои html-файлы похожи на:
index1.html
<h1>Title</h1>
...
[content]
index2.html
<h2>Subtitle</h2>
...
[content]
index3.html
<h3>Sub-subtitle</h3>
...
[content]
Поскольку они представляют собой 3 разных файла, сгенерированное оглавление:
Title --------------------- Page x
Subtitle ------------------ Page y
Sub-subtitle -------------- Page z
вместо
Title--------------------- Page x
Subtitle -------------- Page y
Sub-subtitle ------- Page z
Я попытался объединить все html-файлы вместе, но это вызывает у меня много проблем с внутренними ссылками ... ссылки на файлы вместо HTML #IDs
становится сложно с одним объединенным HTML-файлом.
Есть идеи, как заставить wkhtmltopdf
уважать иерархию H tags
, не сбрасывая ее для каждого файла?
Спасибо!
Edit:
После некоторого обсуждения в разделе вопросов wkhtmltopdf github, единственный простой способ достижения этого результата - предварительный анализ файлов HTML, чтобы объединить их все вместе.
Для получения более подробной информации см. Следующую ссылку: https://github.com/wkhtmltopdf/wkhtmltopdf/issues/4310