Результаты Tesseract 4.0 OCR противоречивы - PullRequest
0 голосов
/ 02 октября 2018

Мы пытаемся выполнить ocr на изображении с 2 символами, и команда tesseract возвращает неверный вывод.

Tesseract processed image

Очевидно, ожидаемый результат должен быть ТВ, но мыполучают AY.

Another tesseract processed image

Результат должен был быть S7 Ep7, но мы получаем [Sa aes].Который, как вы можете видеть, даже не близко.

Обработанные Тессерактом изображения выглядят достаточно четкими, и они должны работать над ними, но получение таких противоречивых результатов на четких изображениях сбивает с толку.

Любые идеи о том, как мы можем добиться лучшего результата.

Для аналогичного изображения мы начинаем получать правильный результат.Пример. Правильный результат изображения

Как вы можете видеть, это похожие изображения с несколькими пикселями вверх и вниз.Но они дают совершенно разные результаты.

...