Я пытался напечатать страницы документа в формате PDF:
import PyPDF2
FILE_PATH = 'my.pdf'
with open(FILE_PATH, mode='rb') as f:
reader = PyPDF2.PdfFileReader(f)
page = reader.getPage(0) # I tried also other pages e.g 1,2,..
print(page.extractText())
Но у меня только много пустого пространства и никаких сообщений об ошибках. Может ли быть так, что эта pdf-версия (my.pdf) не поддерживается PyPDF2?
Это решило ее (печатает все страницы документа). Спасибо
from pdfreader import SimplePDFViewer
fd = open("my.pdf", "rb")
viewer = SimplePDFViewer(fd)
for i in range(1,16): # need range from 1 - max number of pages +1
viewer.navigate(i)
viewer.render()
page_1_content=viewer.canvas.text_content
page_1_text = "".join(viewer.canvas.strings)
print (page_1_text)