Как тренировать тессеракт для распознавания небольших чисел с низким DPI? - PullRequest
3 голосов
/ 24 ноября 2011

Я получаю данные из видео, поэтому у меня нет возможности повторно отсканировать изображение, но я могу масштабировать их при необходимости.

У меня ограниченное количество символов, 1234567890:, но я не могу контролировать dpi исходного изображения или шрифта.

Я пытался обучить тессеракту, но без какого-либо видимого эффекта, тестовый проект расположен в https://github.com/ssbarnea/tesseract-sample, но текущие результаты действительно плохие.

Пример захвата исходного изображения:

enter image description here

Пример постобработанного изображения для распознавания текста:

enter image description here

Как я могу улучшить процесс распознавания в этом случае?

1 Ответ

1 голос
/ 25 ноября 2011

Вы можете попытаться добавить дополнительное пространство по краям изображения, иногда это помогает для тессеракта. Однако механизмы OCR с открытым исходным кодом очень чувствительны к DPI исходного изображения.

...