Wkhtmltopdf: - html документ загружен не полностью - PullRequest
0 голосов
/ 22 января 2020

Я использую python3 pdfkit для извлечения данных с веб-сайта yext.com (что медленно, я должен признать) Чтобы получить нужные мне данные, мне нужно выполнить поиск на сайте, который требует входа пользователя. Поэтому я создаю сеанс и передаю куки сеанса в pdfkit в качестве параметров. Но независимо от того, какую задержку javascript я передаю, результат загружается не полностью. Вот мой код: -

import pdfkit
import requests

username = "******"
password = "******"
payload = {'username': username,
           'password': password}
url = "https://www.yext.com/s/2188464/listings#search=1st+Choice+Inspection+Services"
with requests.Session() as s:
    login_url = "https://www.yext.com/users/login"
    s.post(login_url, data=payload)
    options = {
        'cookie': s.cookies.items(),
        'javascript-delay': 2000
    }
    pdfkit.from_url(url, "xxx2.pdf", options=options)

В приложении показано, как оно отображается на веб-сайте после поиска и как оно отображается в сохраненном PDF-файле. Как вы видите, он все еще загружается. Как исправить? Любые идеи приветствуются. website pdf

...