Запуск распознавания OCR в прямоугольных областях объекта Pix в библиотеках Tess-Two / TesserAct - PullRequest
0 голосов
/ 11 марта 2019

Я получаю результаты распознавания из библиотеки Tess Two.Я реализую ResultIterator с PageIteratorLevel = Ril_Symbol.Я перебираю каждый возвращенный символ, который составляет текст результата распознавания.Я получаю информацию о прямоугольнике для каждого конкретного символа, показывающего положение в пикселе изображения, которое было передано в базовый обратный вызов моего OCR.

Моя цель - различать символы + и ÷.Кажется, что Тесс Два не может отличить символ ÷.Итак, я создаю следующий оператор if:

Rect rect = myIterator.getBoundingRect(myIteratorLevel);

//the symbol has been already previously identified
if(symbol == '+'){
//here I use a different OCR callback which I named base2
base2.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_CHAR);
base2.setImage(?);//what to set here, my original pix or the thresholded image after the original OCR call made with base1 callback
base2.setRectangle(rect);//I hope that it reads the rect where the "+" symbol lies    
Log.d("results","let me see: "+base2.getUTF8Text());   
base2.clear();  
}

Я установил оригинальный объект Pix, который был передан в base1.setImage (mypix), и я также установил изображение Thresholded из вызова base1.getThresholdedImage ();

Установка обоих типов пикселей на base2.setImage ();ничего не возвращает по лог-вызову.

Любой совет будет полезен

...