wkhtmltopdf из списка файлов генерирует неверное содержание на основе тегов H - PullRequest
1 голос
/ 26 марта 2019

Я использую python-pdfkit для создания PDF-файла следующим образом:

pdfkit.from_file(list_of_files, toc=toc, cover=cover, cover_first=True, options=default_options)

Моя проблема связана с созданным оглавлением:

Оглавление генерируется на основе тегов H во входных данных. документы

Если мои html-файлы похожи на:

index1.html

<h1>Title</h1>
...
[content]

index2.html

<h2>Subtitle</h2>
...
[content]

index3.html

<h3>Sub-subtitle</h3>
...
[content]

Поскольку они представляют собой 3 разных файла, сгенерированное оглавление:

Title --------------------- Page x
Subtitle ------------------ Page y
Sub-subtitle -------------- Page z

вместо

Title--------------------- Page x
   Subtitle -------------- Page y
      Sub-subtitle ------- Page z

Я попытался объединить все html-файлы вместе, но это вызывает у меня много проблем с внутренними ссылками ... ссылки на файлы вместо HTML #IDs становится сложно с одним объединенным HTML-файлом.

Есть идеи, как заставить wkhtmltopdf уважать иерархию H tags, не сбрасывая ее для каждого файла?

Спасибо!

Edit:

После некоторого обсуждения в разделе вопросов wkhtmltopdf github, единственный простой способ достижения этого результата - предварительный анализ файлов HTML, чтобы объединить их все вместе.

Для получения более подробной информации см. Следующую ссылку: https://github.com/wkhtmltopdf/wkhtmltopdf/issues/4310

...