Как получить байтовый контент определенной страницы PDF-файла с помощью pdfquery? - PullRequest
0 голосов
/ 16 октября 2019

Я пытаюсь открыть PDF-файл, просмотреть его страницы и сохранить каждую страницу, переименовав ее в код ссылки, указанный на каждой странице. Я использую библиотеку Python pdfquery. Я знаю, как анализировать PDF с pdfquery, но не знаю, как сохранить каждую страницу. Есть ли способ получить байтовое содержимое определенной страницы, чтобы я мог сохранить его как:

import pdfquery
pdf = pdfquery.PDFQuery('oldfile.pdf')
bytes_content = pdf.load(1)

with open('newfile.pdf', 'wb') as f:
    f.write(bytes_content)

Я знаю, что приведенный выше код не работает, так как bytes_content равен NoneType. Если кто-то может помочь мне с этим, я буду благодарен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...