Почему Тессеракт не принимает конфиг? - PullRequest
0 голосов
/ 20 мая 2018

Я пытаюсь заставить tesseract распознавать только числа, но независимо от того, что я добавляю для конфигурации, он игнорирует это.pytessseract в версии 0.2.0 и tesseract в 4.00.00альфа

from PIL import Image

import pytesseract as tes
import glob

tes.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'

a = glob.glob(r'C:\Users\Pascal\Desktop\visible\*.png')

for imgPath in a:
    casd = Image.open(imgPath).convert('L').point(lambda x: 0 if x < 200 else 255, '1')
    im = tes.image_to_string(casd, config='outputbase digits')
    print(im)

Некоторые выходы:

® a 69 ® 0

® a 69 ® 0

® ase ® 0

® aso ® 0

1 Ответ

0 голосов
/ 22 мая 2018

Функция, на которую опирается файл конфигурации digits, не работает в Tesseract 4.0x.

https://github.com/tesseract-ocr/tesseract/issues/751

...