Я получаю неплохие результаты настройки
TessBaseAPI::SetVariable("tessedit_char_whitelist", "0123456789");
, при этом аккуратно убеждая пользователя оставить цифры вписаться в определенное поле.Это облегчает мне поиск чисел и гарантирует, что изображение будет стабильным и на разумном расстоянии, что приведет к более четкому изображению.
Я думал об изменении valid_word () в tesseract-2.04 / dict / permute.cpp, но, похоже, в этом нет необходимости.
Следующим шагом будет жесткое кодирование минимального / максимального размера символа, чтобы время распознавания могло стать намного меньше, чем сейчас 500 мс.Затем следующим шагом будет добавление некоторого кода, который отслеживает результаты во времени, так что чтение 5
90% времени и 8
только 10% приведет к тому, что код запомнит 5
.
Все зависит от используемого вами варианта использования.Мне повезло в том смысле, что мне разрешено просто показать коробку 200x50, которая будет содержать число.