Тессеракт OCR с использованием библиотеки tess4j - PullRequest
0 голосов
/ 08 января 2020

Тессеракт не распознает текст должным образом. Я использую библиотеку tess4j, и я получаю около 50% точности. У меня есть файл TIFF с очень маленьким размером шрифтов. Как я могу улучшить точность?

1 Ответ

0 голосов
/ 08 января 2020

Вы можете очистить изображение для лучшего распознавания, см. https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...