Как добиться текста перед Rect в PDF-файл в pymupdf - PullRequest
0 голосов
/ 11 июля 2019

Я пытаюсь получить координаты, где присутствует "______". Которого я легко смогу достичь с помощью MuPDF. После получения этих Rect Coordinates мне нужно получить строку или символ перед этими Rect координатами.

Моя основная задача - прочитать файл PDF, и там, где есть пользовательский ввод, мне нужно нарисовать там прямоугольник и получить данные для заполнения в этом пользовательском вводе.

Надеюсь, я звучу ясно.

Пожалуйста, посмотрите на мой код, который я делал до сих пор.

import fitz

file = "real.pdf"

doc = fitz.open(file)

def searchTextAndHighLight(page):
  text = "_"
  text_instances = page.searchFor(text)
  i = 0
  for inst in text_instances:
    print(inst)
    print("<----------------------------------------->")
    i+=1
    highlight = page.addRectAnnot(inst)
  print(i)
  doc.save("output.pdf", garbage=4, deflate=True, clean=True)

  for page in doc:
    searchTextAndHighLight(page)

Любые предложения приветствуются для достижения моей цели. Заранее спасибо

...