не могу прочитать pdf документ используя PyPDF2 - PullRequest
0 голосов
/ 22 февраля 2020

Я пытаюсь прочитать текст из файла PDF. Я использую приведенный ниже код, однако, когда я пытаюсь получить текст (ptext), все, что возвращается, - это строковая переменная размера 1 и ее пустой.

Почему текст не возвращается? Я пробовал другие страницы и другую книгу в формате PDF, но то же самое, похоже, я не читаю текст.

import PyPDF2

file = open(r'C:/Users/pdfs/test_file.pdf', 'rb')
fileReader = PyPDF2.PdfFileReader(file)

pageObj = fileReader.getPage(445)
ptext = pageObj.extractText()
...