Как мне напечатать весь контент сайта url
, используя pdfkit
?
Я пытаюсь получить весь контент страницы в .pdf
, но когда я использую метод pdfkit.from_url()
, он не печатает нужную таблицу.
Я заметил, что когда я печатаю с использованием метода pdfkit.from_url()
, я получаю только page header
, который даже содержит class="no-print"
, но когда я перемещаюсь это url
с использованием chromedriver
и использование метода chromedriver
print
, нажав (CTRL + P)
, я получаю нужную таблицу content
.
Я уже пытался использовать 'javascript-delay':'30000'
вместо 'javascript-delay':'5000'
, но это не сработало.
Obs: я использую только chromedriver
для навигации и получения нужных URL веб-страниц. Я знаю, что конфиг должен быть установлен с использованием pdfkit.configuration()
или pdfkit.from_url()
методов.
Как я могу исправить эту проблему?
Код:
import pdfkit
from selenium import webdriver
from time import sleep
path_wkhtmltopdf = r'C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe'
config = pdfkit.configuration(wkhtmltopdf=path_wkhtmltopdf)
url = 'https://consultas.anvisa.gov.br/#/medicamentos/25351181746200579/?numeroRegistro=110850032'
driver = webdriver.Chrome()
driver.get(url)
sleep(5)
pdfkit.from_url(url, "out.pdf", configuration=config, options={'javascript-delay':'5000'})
Фактический выход:
Желаемый выход: