печатать последовательно увеличивающиеся URL в PDF - PullRequest
0 голосов
/ 03 апреля 2019

У меня есть веб-сайт, URL которого заканчивается на jobs / jif / id / 1 - jobs / jif / id / 1298.Мне нужно распечатать каждую из этих страниц в формате PDF.Есть подвох.Информация на сайте защищена путем входа на сайт.Эту проблему я игнорирую, пока не выясню, как печатать в pdf с указанием URL.

Я пытался использовать curl, но для меня это был тупик.Сейчас я использую pdfkit для печати каждой страницы.Я не женат на использовании pdfkit или python.Если бы я мог исправить файл с битой, это было бы хорошо.

import pdfkit

url = 'https://registration.vtbigevent.org/committee/jobs/jif/id/'
config = pdfkit.configuration(wkhtmltopdf="C:/Program Files/wkhtmltopdf/bin")
for ids in range(1,1298):
    new_url = url + str(ids)
    pdf = str(ids) + '.pdf'
    pdfkit.from_url(new_url, pdf, configuration=config)

Он должен создать 1298 PDF-файлов в папке.

Фактические результаты - ошибка компиляции с wkhtmltopdf.

PermissionError: [Errno 13] Отказано в разрешении: 'C: / Program Files / wkhtmltopdf / bin'

Другая проблема заключается в том, что я знаю, что это не сохранит PDF-файл в нужную папку, но этосейчас имеет низкий приоритет.

Я отредактировал свой код, добавив конфигурацию = config в строку pdfkit.Это делает то, что я думаю, что делает?Я все еще получаю ошибку разрешения.

...