Я пытаюсь получить координаты, где присутствует "______". Которого я легко смогу достичь с помощью MuPDF. После получения этих Rect Coordinates мне нужно получить строку или символ перед этими Rect координатами.
Моя основная задача - прочитать файл PDF, и там, где есть пользовательский ввод, мне нужно нарисовать там прямоугольник и получить данные для заполнения в этом пользовательском вводе.
Надеюсь, я звучу ясно.
Пожалуйста, посмотрите на мой код, который я делал до сих пор.
import fitz
file = "real.pdf"
doc = fitz.open(file)
def searchTextAndHighLight(page):
text = "_"
text_instances = page.searchFor(text)
i = 0
for inst in text_instances:
print(inst)
print("<----------------------------------------->")
i+=1
highlight = page.addRectAnnot(inst)
print(i)
doc.save("output.pdf", garbage=4, deflate=True, clean=True)
for page in doc:
searchTextAndHighLight(page)
Любые предложения приветствуются для достижения моей цели. Заранее спасибо