PyTesseract - распознает цифры в простом изображении - PullRequest
0 голосов
/ 01 января 2019

Я пытаюсь использовать pytesseract для распознавания двух чисел на изображении:

enter image description here

  • Я пытался --psm 6 до10
  • Я пытался -c tessedit_char_whitelist=0123456789'

Ни один из вышеперечисленных не возвращает 49 номер.Ближайший, который я получил, возвращается 4 без 9

У вас есть какие-либо советы о том, как заставить тессеракт распознать его?

Ответы [ 2 ]

0 голосов
/ 04 января 2019

Попробуйте --psm 13 --oem 3 (oem = 1 или 2 также должны сделать)

import pytesseract
from PIL import Image
import requests
import io

response = requests.get('https://i.stack.imgur.com/oAAXR.png')
text = pytesseract.image_to_string(Image.open(io.BytesIO(response.content)), lang='eng',
                    config='--psm 13 --oem 3 -c tessedit_char_whitelist=0123456789')

print(text)

дает 49, как вы ожидаете на моей машине.

Я получаю тот же результатскачав изображение локально и запустив

tesseract oAAXR.png output --oem 3 --psm 13 -l eng

Для справки мой tesseract --version дает tesseract 4.0.0 leptonica-1.77.0 libgif 5.1.4 : libjpeg 8d (libjpeg-turbo 2.0.1) : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.1 Found AVX2 Found AVX Found SSE.

0 голосов
/ 02 января 2019

Вы пробовали разные --oem?Я также попытался бы использовать --psm выше 10.

...