Java PDF манипулирование, замена текста на основе сопоставления с шаблоном, с гиперссылкой - PullRequest
1 голос
/ 02 марта 2011

Кто-нибудь знает, как лучше всего взять pdf-документ и заменить все подстроки, которые соответствуют шаблону ([AZ] [AZ] [AZ] '' [0-9] [0-9] [0- 9] [0-9] | [AZ]) и замените его гиперссылкой с той же строкой, идущей на ту же строку.

Я планирую разрешить пользователю просматривать документ в формате pdf (который представляет собой список классов, которые они могут получить за степень) и разрешить пользователю щелкнуть класс, чтобы добавить его в список.

Я понимаю, что могу добавить гиперссылку в JEditorPane, и я предполагаю, что она будет работать с гиперссылками в формате PDF (я надеюсь)

Я смотрю в pdfbox и iText, но пока что застрял на том, как заменить текст.

* Я планирую извлечь PDF-файлы из URL-адреса и отформатировать гиперссылки на лету (также нет необходимости экспортировать в файл).

Ждем обратной связи.

1 Ответ

2 голосов
/ 02 марта 2011

Я нашел этот пример http://pdfbox.apache.org/apidocs/org/apache/pdfbox/examples/pdmodel/ReplaceString.html

Включив в код сопоставление с образцом, я могу обновлять текст и заменять строки, соответствующие шаблону, строками на основе строки, которую я заменяю.

...