выгрузка PDF документа (* .pdf) в текст? - PullRequest
6 голосов
/ 27 ноября 2010

Здесь я получил большую помощь (раздел кода) для вывода слова doc в текст.Теперь я ищу помощь в выводе PDF документа (* .pdf) в текст?Я использую Delphi 2010. Я бы предпочел некомпонентное решение, отличное от Active-X .... поскольку этот код будет включен в мой собственный компонент.

Спасибо

Ответы [ 4 ]

4 голосов
/ 27 ноября 2010

Насколько я могу судить, у вас есть две бесплатные опции.

Во-первых, в пакете xpf есть инструмент командной строки, который можно бесплатно получить из http://www.foolabs.com/xpdf

Затем,другой инструмент командной строки в проекте http://mupdf.com

Оба могут быть легко вызваны из Delphi.Я без проблем использовал файл pdftotext.exe из xpdf.

3 голосов
/ 27 ноября 2010

PDFtext может это сделать. Вы должны будете заплатить 57 долларов и развернуть дополнительную DLL.

1 голос
/ 28 ноября 2010

Я использовал библиотеку QuickPDF для поиска текста в файлах PDF.Я использую функцию

GetPageText(ExtractOptions: Integer): string;

, чтобы получить текст с каждой страницы, чтобы его можно было искать.Если вы используете 0 для ExtractOptions, он вернет текст в читаемом формате.Это не бесплатно, но и библиотека, и документация очень хороши.Кроме того, на их веб-сайте размещен очень активный блог сообщества.

0 голосов
/ 20 июня 2019

Я не пробовал, но TSMPDFReader , кажется, вам подходит: нет DLL, нет Activex, нет внешнего компонента. Не бесплатно, но 35 € не слишком дорого.

Я работаю с другими компонентами из Scalabium: отличная поддержка.

...