Тессеракт не учитывает его переменные - PullRequest
0 голосов
/ 17 апреля 2020

Я пытаюсь заставить Тессеракт распознавать только числа, я пытался установить переменные ниже до и после инициализации Тессеракта и непосредственно перед распознаванием, но это никогда не работало, так как иногда мне возвращались письма. Когда я вызываю GetStringVariable для ранее установленных переменных, он возвращает мне правильное значение.

Что я делаю неправильно? Спасибо.

tess->SetPageSegMode(tesseract::PSM_SINGLE_LINE);
tess->SetVariable("classify_bln_numeric_mode", "1");
tess->SetVariable("tessedit_char_whitelist", "0123456789");

1 Ответ

0 голосов
/ 19 апреля 2020

Вот что я сделал в python. Он выводит только цифры. Но, к сожалению, иногда это зависит от типа шрифта, распознайте I как 1, а Q как 0.

sample.png

tesseract sample.png stdout -l eng --oem 3 --psm 6 -c tessedit_char_whitelist="0123456789"
2679
062171
21016
30363
2873
280929
3829
0584
8400
4523
0016
03016
4335
0205
20932
3760
02306
18204
6804
5866
...