Сделать тессеракт распознавать цифры - PullRequest
0 голосов
/ 06 июня 2018

После бинаризации:

Imgproc.CvtColor(mat, mat, Imgproc.ColorBgr2gray);

Imgproc.GaussianBlur(mat, mat, new OpenCV.Core.Size(5, 5), 2);

Threshold(mat, mat, 100, 255, Imgproc.ThreshBinary);
Imgproc.Dilate(mat, mat, Imgproc.GetStructuringElement(Imgproc.MorphRect, new OpenCV.Core.Size(15, 15)));
Imgproc.Erode(mat, mat, Imgproc.GetStructuringElement(Imgproc.MorphRect, new OpenCV.Core.Size(11, 11)));

... поиск контуров, определение ROI и перемещение его на новый мат, изменение размера до 300DPI Тессеракт, похоже, не распознает ни одной цифры.

Изображение после улучшения качества выглядит следующим образом:

enter image description here

Тессеракт имеет следующие настройки:

tessBaseApi.SetPageSegMode(TessBaseAPI.OemTesseractCubeCombined);
tessBaseApi.SetVariable(TessBaseAPI.VarCharWhitelist, "0123456789");

Любойрешения, чтобы заставить его распознавать цифры?

...