Тессеракт Рукописные Цифры Сбои - PullRequest
0 голосов
/ 22 октября 2019

Я пытаюсь обучить тессеракту с помощью набора данных mnist, используя jtessbox. Сначала я создаю изображения и коробочные файлы, как это. Образец В наборе данных есть 60 000 изображений цифр, и я могу создать так много новых изображений, как образец. После создания набора данных я создаю коробочные файлы. После этого с помощью jTessBoxEditor на вкладке трейнера я выбираю объединить_тессоры.exe в качестве исполняемых файлов tesseract и один из вновь созданных образов как Данные обучения после того, как все выполнено, я выбираю Train с существующим боксом и бегом.

(я пробую модели на VietOcr.)

Если я создаю 1.000 выборок и их блоков, модель предсказывает 0 или 2, как этоничему не научился

Но если я создам 50 выборок с их прямоугольниками, модель предсказывает более точные, но все еще довольно плохие прогнозы.

Итак, мой вопрос: где я делаю не так? Я пропущу шаг или тессеракт не сможет выучить рукописные цифры?

...