iText Search, Highlight, изображение результата - PullRequest
2 голосов
/ 15 декабря 2010

Я хочу выполнить следующие задачи: 1 - найти слово в pdf 2 - выделить все вхождения в этом pdf, 3 - сохранить выделенный pdf как изображения его страниц.

Как я могу это сделать?Любая помощь будет оценена.

1 Ответ

1 голос
/ 15 декабря 2010

com.itextpdf.text.pdf.parser.LocationTextExtractionStrategy

Это даст вам базовую линию, подъем и спуск каждого фрагмента текста на странице. Это зависит от вас, чтобы построить слова и прямоугольники из этой информации.

Не просто, но возможно.

После этого вам просто нужно вызвать GhostScript или PDFBox или что-то, что может отображать PDF-файлы. Вряд ли "легкая часть", но это многократно решаемая проблема.

...