Как я могу использовать PDFKit для печати всего содержимого страницы? Нужная таблица не отображается в моем сгенерированном файле PDF - PullRequest
0 голосов
/ 13 января 2020

Как мне напечатать весь контент сайта url, используя pdfkit?

Я пытаюсь получить весь контент страницы в .pdf, но когда я использую метод pdfkit.from_url() , он не печатает нужную таблицу.

Я заметил, что когда я печатаю с использованием метода pdfkit.from_url(), я получаю только page header, который даже содержит class="no-print", но когда я перемещаюсь это url с использованием chromedriver и использование метода chromedriver print, нажав (CTRL + P), я получаю нужную таблицу content.

Я уже пытался использовать 'javascript-delay':'30000' вместо 'javascript-delay':'5000', но это не сработало.

Obs: я использую только chromedriver для навигации и получения нужных URL веб-страниц. Я знаю, что конфиг должен быть установлен с использованием pdfkit.configuration() или pdfkit.from_url() методов.

Как я могу исправить эту проблему?


Код:

import pdfkit
from selenium import webdriver
from time import sleep

path_wkhtmltopdf = r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf=path_wkhtmltopdf)
url = 'https://consultas.anvisa.gov.br/#/medicamentos/25351181746200579/?numeroRegistro=110850032'
driver = webdriver.Chrome()
driver.get(url)
sleep(5)
pdfkit.from_url(url, "out.pdf", configuration=config, options={'javascript-delay':'5000'})

Фактический выход:

actual

Желаемый выход:

desired

...