Проблема с выделением текста в pdf документе python - PullRequest
0 голосов
/ 08 ноября 2019

Я пытаюсь написать скрипт на python, который бы автоматизировал процесс поиска текста в pdf и выделил в соответствии с

Я использую модуль python для pymupdf. Это работает для некоторых PDF. Однако, когда для целевого pdf (рисование таблиц компонентов и свойств) будет сохранен вывод в виде пустого pdf без данных и некоторых пустых выделений.

import fitz

doc=fitz.open("c5.pdf")

page = doc[0]

text = "a"

text_instances = page.searchFor(text)

for inst in text_instances:
    highlight = page.addHighlightAnnot(inst)


doc.save("out.pdf", garbage=4, deflate=True, clean=True)
...