Как извлечь конкретные слова из PDF-файла и сохранить в Excel? - PullRequest
0 голосов
/ 27 мая 2019

Я не могу извлечь определенные слова из файла PDF

http://www.careratings.com/upload/CompanyFiles/PR/Reliance%20Capital%20Ltd.-05-18-2019.pdf

import PyPDF2

pdf_file = open('Reliance Capital Ltd.-05-18-2019.pdf', 'rb')

read_pdf = PyPDF2.PdfFileReader(pdf_file)

number_of_pages = read_pdf.getNumPages()

page = read_pdf.getPage(0)

page_content = page.extractText()

print(page_content)

Я хочу извлечь название компании, дату и первую таблицу в формате Excel, кромеколонка "Сумма", но я не могу ее извлечь

...