Python не печатает PDF с pyPDF2 - PullRequest
       28

Python не печатает PDF с pyPDF2

1 голос
/ 21 апреля 2020

Я пытался напечатать страницы документа в формате PDF:

import PyPDF2
FILE_PATH = 'my.pdf'
with open(FILE_PATH, mode='rb') as f:
    reader = PyPDF2.PdfFileReader(f)
    page = reader.getPage(0) # I tried also other pages e.g 1,2,..
    print(page.extractText())

Но у меня только много пустого пространства и никаких сообщений об ошибках. Может ли быть так, что эта pdf-версия (my.pdf) не поддерживается PyPDF2?

Это решило ее (печатает все страницы документа). Спасибо

from pdfreader import SimplePDFViewer
fd = open("my.pdf", "rb")
viewer = SimplePDFViewer(fd)
for i in range(1,16): # need range from 1 - max number of pages +1
    viewer.navigate(i)
    viewer.render()
    page_1_content=viewer.canvas.text_content
    page_1_text = "".join(viewer.canvas.strings)
    print (page_1_text)

Ответы [ 2 ]

0 голосов
/ 21 апреля 2020

Попробуйте pdfreader

from pdfreader import SimplePDFViewer

fd = open("my.pdf", "rb")
viewer = SimplePDFViewer(fd)
viewer.render()

page_0_content=viewer.canvas.text_content
page_0_text = "".join(viewer.canvas.strings)
0 голосов
/ 21 апреля 2020

Если оно пустое, либо PDF читается, а его формат не может быть прочитан pypdf, поэтому он просто выводит пустое. Возможно, укажите абсолютный путь к файлу вместо относительного пути к файлу. Если ничего не помогло, попробуйте другие PDF-файлы, и если есть версия, которая работает, а ваша нет, вам может потребоваться преобразовать свою версию в этот рабочий тип.

...