Я вижу, что вы в Windows, поэтому это , как вы устанавливаете его в Windows! Сначала нужно правильно установить файлы setup.py .
- cd C: \ Users \ User \ Downloads \ pyPDF2, чтобы перейти в каталог, где находится setup.py
- C: \ python27 \ python.exe setup.py install Я использую Python2.7 здесь. Используйте C: \ python33 \ python.exe setup.py install для python 3.3 и так далее.
Это самый быстрый способ сделать это (проверьте источник !!)
Относительно того, как извлечь это, есть много обучающих программ. Вы должны следовать официальным документам и заслуживающим доверия веб-сайтам! Здесь является примером!
from PyPDF2 import PdfFileReader
def text_extractor(path):
with open(path, 'rb') as f:
pdf = PdfFileReader(f)
# get the first page
page = pdf.getPage(1)
print(page)
print('Page type: {}'.format(str(type(page))))
text = page.extractText()
print(text)
if __name__ == '__main__':
path = 'reportlab-sample.pdf'
text_extractor(path)