У меня есть веб-сайт, URL которого заканчивается на jobs / jif / id / 1 - jobs / jif / id / 1298.Мне нужно распечатать каждую из этих страниц в формате PDF.Есть подвох.Информация на сайте защищена путем входа на сайт.Эту проблему я игнорирую, пока не выясню, как печатать в pdf с указанием URL.
Я пытался использовать curl, но для меня это был тупик.Сейчас я использую pdfkit для печати каждой страницы.Я не женат на использовании pdfkit или python.Если бы я мог исправить файл с битой, это было бы хорошо.
import pdfkit
url = 'https://registration.vtbigevent.org/committee/jobs/jif/id/'
config = pdfkit.configuration(wkhtmltopdf="C:/Program Files/wkhtmltopdf/bin")
for ids in range(1,1298):
new_url = url + str(ids)
pdf = str(ids) + '.pdf'
pdfkit.from_url(new_url, pdf, configuration=config)
Он должен создать 1298 PDF-файлов в папке.
Фактические результаты - ошибка компиляции с wkhtmltopdf.
PermissionError: [Errno 13] Отказано в разрешении: 'C: / Program Files / wkhtmltopdf / bin'
Другая проблема заключается в том, что я знаю, что это не сохранит PDF-файл в нужную папку, но этосейчас имеет низкий приоритет.
Я отредактировал свой код, добавив конфигурацию = config в строку pdfkit.Это делает то, что я думаю, что делает?Я все еще получаю ошибку разрешения.