Как я могу извлечь информацию из PDF-файла, где информация находится рядом с таким атрибутом, как Userid: Abhisheek? - PullRequest
0 голосов
/ 08 февраля 2020

У меня есть PDF-файл, в котором есть информация, подобная

Имя пользователя: Abhisheek Идентификатор пользователя: Mondal

Категория клиента: Общие сведения

Я хочу извлечь информацию ассоциируется только с именем пользователя и делает имя пользователя именем столбца, а Abhisheek - полем. Любая идея, если кто-то сделал подобное упражнение?

Я пытался использовать текст ниже, но не работает.

import PyPDF2

pdfFileObj = open(r'sample.pdf', 'rb')

pdfReader = PyPDF2.PdfFileReader(pdfFileObj)

print(pdfReader.numPages)

pageObj = pdfReader.getPage(0)

print(pageObj.extractText())
...