Извлечь стрелки из формы pdf - PullRequest
0 голосов
/ 13 июня 2019

У меня есть PDF с аннотациями, сделанными с помощью Adobe Acrobat.Я извлек текст и координаты блоков с помощью пакета fitz python, однако есть поля, в которых есть стрелки.Мне также нужно извлечь координаты стрелок.

pdf = fitz.open('/home/dfoundry/Downloads/blankcrf.pdf')
import fitz

for i in range(n):
    page = pdf[i]

    content=[] # for content
    coordinates=[] # for rectangle coordinates
    color=[] # for rectangle RGB colors

    x = page.firstAnnot

    i=0
    while True:
        try:
            if x.info['content']!="":
                content.append(x.info['content'])
                coordinates.append(x.rect)
                color.append(x.colors)
            x = x.next
        except AttributeError:
            break
        i+=1

pdf.close()
...