PyMuPDF - текстовое поле для чтения / записи - PullRequest
0 голосов
/ 22 мая 2018

Мне удалось прочитать содержимое PDF-файлов с помощью: PYMuPDF, используя код, подобный следующему:

myfile = r"C:\users\xxx\desktop\testpdf1.pdf"
doc  =fitz.open(myfile)
page=doc[1]
text = page.getText("text")

, чтобы прочитать содержимое файлов PDF, однако я не могу прочитать аннотации текстовых полейЕсть ли способ сделать это?

1 Ответ

0 голосов
/ 22 мая 2018

Используйте firstAnnot на объекте страницы.Если у вас есть объект аннотации, похоже, что вы можете вызвать next и получить остальные.Обратите внимание на пример внизу страницы Annot.

Я создал PDF из документа Word и добавил одно текстовое поле и одну заметку.Следующий код напечатал содержимое каждого.Загляните внутрь info для получения другой необходимой вам информации.

import fitz

pdf = fitz.open('WordTest.pdf')
page = pdf[0]
annot = page.firstAnnot
print(annot.info['content'])
next_annot = annot.next
print(next_annot.info['content'])
pdf.close()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...