У меня есть PDF с аннотациями, сделанными с помощью Adobe Acrobat.Я извлек текст и координаты блоков с помощью пакета fitz python, однако есть поля, в которых есть стрелки.Мне также нужно извлечь координаты стрелок.
pdf = fitz.open('/home/dfoundry/Downloads/blankcrf.pdf')
import fitz
for i in range(n):
page = pdf[i]
content=[] # for content
coordinates=[] # for rectangle coordinates
color=[] # for rectangle RGB colors
x = page.firstAnnot
i=0
while True:
try:
if x.info['content']!="":
content.append(x.info['content'])
coordinates.append(x.rect)
color.append(x.colors)
x = x.next
except AttributeError:
break
i+=1
pdf.close()