Я пытаюсь обучить тессеракту с помощью набора данных mnist, используя jtessbox. Сначала я создаю изображения и коробочные файлы, как это. Образец В наборе данных есть 60 000 изображений цифр, и я могу создать так много новых изображений, как образец. После создания набора данных я создаю коробочные файлы. После этого с помощью jTessBoxEditor на вкладке трейнера я выбираю объединить_тессоры.exe в качестве исполняемых файлов tesseract и один из вновь созданных образов как Данные обучения после того, как все выполнено, я выбираю Train с существующим боксом и бегом.
(я пробую модели на VietOcr.)
Если я создаю 1.000 выборок и их блоков, модель предсказывает 0 или 2, как этоничему не научился
Но если я создам 50 выборок с их прямоугольниками, модель предсказывает более точные, но все еще довольно плохие прогнозы.
Итак, мой вопрос: где я делаю не так? Я пропущу шаг или тессеракт не сможет выучить рукописные цифры?