Искать текст в pdf - PullRequest
       30

Искать текст в pdf

0 голосов
/ 10 февраля 2012

Может кто-нибудь сказать мне, можно ли использовать AcrobatAccessLib (библиотека типов Acrobat Access 3.0) в ссылках com для поиска текста в документе PDF? Он содержит класс PDDom, но я не знаю, смогу ли я загрузить в него документ или как с ним работать.

(я не хочу использовать iTextSharp и другие, я пробовал его, но не работает так, как хотел - pdf имеет поврежденную подкачку номеров + содержит таблицы, которые находятся на 2 страницах - iTextSharp обнаруживает, что я ищу текст на обеих страницах - вместо 1 , но если я использую Acrobat Reader - он работает хорошо)

РЕДАКТИРОВАТЬ: Или другой вопрос, могу ли я использовать Acrobat Reader и его модуль поиска в моем приложении?

Я работаю в C #

Большое спасибо!

Ответы [ 2 ]

1 голос
/ 10 февраля 2012

Если деньги не проблема, я бы по компонентам Aspose PDF.Они работают довольно хорошо и созданы для использования на сервере.

1 голос
/ 10 февраля 2012

Попробуйте использовать PDFLIBNET.DLL

, поскольку в этом dll есть класс pdfwrapper, этот класс предоставляет множество методов для получения текста из pdf.Метод FindText, используемый для получения текста с определенной позиции, а метод exportToText выдает содержимое pdf-страницы

из этого содержимого. Вы будете искать содержимое pdf.

am с помощью tat DLL и поискасодержание PDF без каких-либо проблем ..

попробуйте и дайте мне знать ..

...