У меня есть определенный набор из 10 изображений для оптического распознавания текста. Они все цифры; несколько коротких, около 20 цифр на каждом изображении. Есть одно конкретное изображение, если я запустил его первым, оно будет иметь некоторые несоответствия; однако, если я сначала запускаю другие тесты, а затем возвращаюсь к этому, все символы совпадают.
Я склонен заключить, что Тессеракт изучает символы по мере выполнения большего количества операций OCR, что меня очень радует. Теперь вопрос, если это возможно, для меня, чтобы сохранить учебные данные, так что Тессеракт будет знать, чтобы забрать их в следующий раз, когда я буду их использовать?