Чтение чекбокса pdf с python на заполненной форме - PullRequest
0 голосов
/ 05 июля 2018

Мне трудно читать из заполненной формы, если флажок установлен (отмечен галочкой) или нет. В настоящее время я использую PyPDF2 для извлечения текста, который работает довольно хорошо.

Это мой код:

from PyPDF2 import PdfFileReader

infile = "test.pdf"
pdf_reader = PdfFileReader(open(infile, "rb"))

dictionary = pdf_reader.getFormTextFields() # returns a python dictionary

Если у кого-нибудь есть намеки на это, я буду очень благодарен:)

Ура, Аструс

1 Ответ

0 голосов
/ 21 октября 2018

PyPDF2 также имеет команду getFields (), которая возвращает статус чекбоксов. В вашем примере вы бы назвали это с помощью pdf_reader.getFields (). Он вернет словарь, содержащий имя флажка, статус проверки («Да», если отмечен, пустой, если не отмечен) и некоторую другую информацию. По моему опыту, название флажка менее чем полезно, поэтому выяснить, как связать результаты флажка с текстом, может быть непросто.

Вот документация для getFields: https://pythonhosted.org/PyPDF2/PdfFileReader.html#PyPDF2.PdfFileReader.getFields

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...