Как извлечь текст из PDF и сброс информации в базу данных с помощью Python - PullRequest
0 голосов
/ 18 марта 2019

Как извлечь текст из PDF и сбросить информацию в базу данных с помощью Python?Как мне установить PyPDF2 ?

Я пытался сделать это, но это показывает следующую проблему

1 Ответ

0 голосов
/ 18 марта 2019

Я вижу, что вы в Windows, поэтому это , как вы устанавливаете его в Windows! Сначала нужно правильно установить файлы setup.py .

  • cd C: \ Users \ User \ Downloads \ pyPDF2, чтобы перейти в каталог, где находится setup.py
  • C: \ python27 \ python.exe setup.py install Я использую Python2.7 здесь. Используйте C: \ python33 \ python.exe setup.py install для python 3.3 и так далее.

Это самый быстрый способ сделать это (проверьте источник !!)

Относительно того, как извлечь это, есть много обучающих программ. Вы должны следовать официальным документам и заслуживающим доверия веб-сайтам! Здесь является примером!

from PyPDF2 import PdfFileReader
def text_extractor(path):
    with open(path, 'rb') as f:
        pdf = PdfFileReader(f)
        # get the first page
        page = pdf.getPage(1)
        print(page)
        print('Page type: {}'.format(str(type(page))))
        text = page.extractText()
        print(text)
if __name__ == '__main__':
    path = 'reportlab-sample.pdf'
    text_extractor(path)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...