У меня есть PDF-файл, в котором есть информация, подобная
Имя пользователя: Abhisheek Идентификатор пользователя: Mondal
Категория клиента: Общие сведения
Я хочу извлечь информацию ассоциируется только с именем пользователя и делает имя пользователя именем столбца, а Abhisheek - полем. Любая идея, если кто-то сделал подобное упражнение?
Я пытался использовать текст ниже, но не работает.
import PyPDF2
pdfFileObj = open(r'sample.pdf', 'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj)
print(pdfReader.numPages)
pageObj = pdfReader.getPage(0)
print(pageObj.extractText())