Tesseract 4.5 возвращает несколько результатов для одной и той же структуры изображения - PullRequest
0 голосов
/ 14 июля 2020

Привет всем, у меня проблема с tess4j с Arabi c .trainddata проблема в том, что когда я получаю результат два раза, результаты были разными, как это первый результат:

"| رقم القيد?: 139 \ n" +

"18.02.2020:? التاريخ \ n" +

"SYRIA HO:? الفرع? \ N" +

второй вывод:

"رقم القيد?: 439 \ n" +

"التاريخ: 08/07/2020 \ n" +

"الفرع:? SYRIA HO? \ N" +

последний необработанный файл является обратным, и он может быть другим необработанным в другом выходе

пожалуйста, мне нужно решение для сделать ocr всегда начинать чтение из RTL или всегда давать мне один и тот же результат

и благодарить за всех :)

1 Ответ

0 голосов
/ 25 июля 2020

Tesseract изучает или адаптирует свои результаты в ходе последовательных запусков. Вам необходимо очистить его адаптивный классификатор или кеш (с помощью метода ClearAdaptiveClassifier, ClearPersistentCache​ или Clear), чтобы получить тот же результат при последующих запусках.

...