Компонент просмотра .NET PDF для поиска / выделения нескольких слов - PullRequest
1 голос
/ 29 ноября 2010

Я ищу компонент, который позволяет выделять определенные слова в документе PDF.Он будет использоваться для поиска.

Некоторые компоненты выделяются при выполнении поиска, но выделяют только текст, который в данный момент ищется.Мне нужны более продвинутые функции для отображения нескольких поисковых слов.

В конечном итоге это будет выглядеть как поиск нескольких слов одновременно.

Возможным решением будет преобразование в обычный текст и выделение в RichTextBox, нонеобходимо сохранить фактическое форматирование документа.

Есть предложения?

Спасибо!

Ответы [ 2 ]

2 голосов
/ 30 ноября 2010

Я не знаю каких-либо готовых решений для чего-то подобного.

Единственное, что мне известно о том, что может работать для этого, - это встроенный читатель / акробат с пользовательским плагином, который будет обрабатывать множественные поиски и подсветку.

IIRC, публикация плагинов acrobat очень проста, но для того, чтобы «включить читательские» плагины, нужно, чтобы Adobe подписала их для вас, что включает в себя немного $$$.

Решительно нетривиально.

«Сохранение фактического форматирования» на самом деле невозможно. * * * * * * * * * * * * * В PDF-формате нет форматирования * 1012 для сохранения. Там есть координаты, глифы, линии и изображения (и прочее). Нет такой вещи, как слово или абзац, выравнивание и т. Д. Все это «нарисуйте эту форму там». Большинство символов отображаются на символы, но не на все. Некоторые линии выглядят как глифы, но являются прямыми линиями.

Можно воссоздать информацию о форматировании по координатам и символам, но это сложно , и есть много вещей, которые могут пойти не так.

Тегу PDF действительно нужен FAQ, который бы охватывал подобные вещи.

1 голос
/ 30 ноября 2010

В webSupergoo есть компонент ABCpdf.NET , который позволит вам читать и изменять файлы PDF, а профессиональная версия также будет отображать / просматривать их непосредственно в вашем приложении. Может быть возможно использовать это, чтобы добавить выделение к словам, которые вы ищете, а затем отобразить результат.

Примечание. Я использовал этот компонент для создания PDF-файлов, но никогда не изменял и не отображал их, поэтому я не могу напрямую сказать, насколько хорошо это будет работать.

...