Question

Мне удалось прочитать содержимое PDF-файлов с помощью: PYMuPDF, используя код, подобный следующему:

myfile = r"C:\users\xxx\desktop\testpdf1.pdf"
doc  =fitz.open(myfile)
page=doc[1]
text = page.getText("text")

, чтобы прочитать содержимое файлов PDF, однако я не могу прочитать аннотации текстовых полейЕсть ли способ сделать это?

J. Owens · Answer 1 · 22 мая 2018

Используйте firstAnnot на объекте страницы.Если у вас есть объект аннотации, похоже, что вы можете вызвать next и получить остальные.Обратите внимание на пример внизу страницы Annot.

Я создал PDF из документа Word и добавил одно текстовое поле и одну заметку.Следующий код напечатал содержимое каждого.Загляните внутрь info для получения другой необходимой вам информации.

import fitz

pdf = fitz.open('WordTest.pdf')
page = pdf[0]
annot = page.firstAnnot
print(annot.info['content'])
next_annot = annot.next
print(next_annot.info['content'])
pdf.close()

PyMuPDF - текстовое поле для чтения / записи

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

PyMuPDF - текстовое поле для чтения / записи

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов