тессеракт ocr многостраничный pdf зависает - PullRequest
0 голосов
/ 12 июля 2011

Мы используем Java-библиотеку Tesseract под названием Tess4j для преобразования PDF-файлов в текстовые.Он прекрасно работает как с файлами Tiff, так и с одностраничными файлами PDF.Но в многостраничных PDF-файлах он генерирует выходной файл. Когда дело доходит до последней страницы, элемент управления, похоже, не возвращается к исходному приложению, которое вызвало вызов doOCR.Он просто остается / висит там, ничего не делая.Это проблема с собственным вызовом, который не возвращается обратно. Я не знаю,

Пожалуйста, дайте мне знать, если есть решение этой проблемы, как можно скорее.

С уважением
Vish

1 Ответ

0 голосов
/ 16 июля 2011

Tess4J поддерживает многостраничный PDF и многостраничный TIFF. Замените файл PDF в тестовом блоке и попробуйте.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...