Я не знаю каких-либо готовых решений для чего-то подобного.
Единственное, что мне известно о том, что может работать для этого, - это встроенный читатель / акробат с пользовательским плагином, который будет обрабатывать множественные поиски и подсветку.
IIRC, публикация плагинов acrobat очень проста, но для того, чтобы «включить читательские» плагины, нужно, чтобы Adobe подписала их для вас, что включает в себя немного $$$.
Решительно нетривиально.
«Сохранение фактического форматирования» на самом деле невозможно. * * * * * * * * * * * * * В PDF-формате нет форматирования * 1012 для сохранения. Там есть координаты, глифы, линии и изображения (и прочее). Нет такой вещи, как слово или абзац, выравнивание и т. Д. Все это «нарисуйте эту форму там». Большинство символов отображаются на символы, но не на все. Некоторые линии выглядят как глифы, но являются прямыми линиями.
Можно воссоздать информацию о форматировании по координатам и символам, но это сложно , и есть много вещей, которые могут пойти не так.
Тегу PDF действительно нужен FAQ, который бы охватывал подобные вещи.