Почему PyTesseract считает, что 0 - это 9? - PullRequest
0 голосов
/ 22 января 2020

Я довольно новичок в Tesseract, и меня удивляет, почему он смотрит на это изображение и называет его 9. Вот мой код - я использую неверную конфигурацию или что-то? Мне кажется, что в середине 0 есть крошечный темный кусочек, который сбрасывает тессеракт - есть ли способ исправить это? Спасибо !!

import pytesseract
im = cv2.imread('0or9.png')
text = pytesseract.image_to_string(im, lang='eng',
        config='--psm 13 --oem 3  '
          '-c tessedit_char_whitelist=90Oo')
print(text)  # prints a 9

0or9.png

...