Чтение из PDF с возможностью поиска, без ocr - PullRequest
0 голосов
/ 15 декабря 2011

В настоящее время я использую свой сканер, чтобы превратить мои PDF-файлы в PDF-файлы с возможностью поиска. Об OCR уже позаботились, так как я могу использовать ctrl-f в PDF.

Как мне узнать содержание OCR из моей программы?

Я открыт для использования java, ruby, вопрос не зависит от языка программирования. Является ли текст OCR открытым для чтения при чтении файла?

1 Ответ

1 голос
/ 15 декабря 2011

Не знаю, как программное обеспечение OCR создает PDF, но не могли бы вы использовать стороннюю библиотеку (jPedal) или такой инструмент, как iText или XPDF извлечь текст из полученного PDF?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...