Тессеракт: Распознать обычный мульти-ди git номер - PullRequest
0 голосов
/ 09 февраля 2020

по какой-то странной причине tesseract не может распознать следующее изображение. Я пробовал различные параметры конфигурации , такие как:

  • --psm 13: "Обрабатывать изображение как одну текстовую строку"
  • tessedit_char_whitelist=012345678iI': разрешать только цифры (и это можно заменить позже).

Это изображение:

plain number

Может быть, это моя предварительная обработка, но для меня картина выглядит хорошо (я также пытался увеличить границы вокруг числа). Любой совет будет высоко оценен! Не удалось найти ничего полезного ни Google, ни SO.

Спасибо!

1 Ответ

0 голосов
/ 10 февраля 2020

разобрался: pytesseract.image_to_string(img, config='digits')

...