Pytesseract не восстанавливает очень четкое изображение - PullRequest
0 голосов
/ 28 января 2019

Я применил pytesseract в трех похожих изображениях цифры «2».Только в последнем случае pytesseract корректно воссоздает цифру.Эти три изображения имеют разные размеры, и если я правильно изменю размер изображения, Pytesseract правильно их переконфигурирует.Но я не понимаю, как такой мощный тессеракт, как ocr, плохо работает на таком простом и ясном изображении.

первое изображение, не удается распознать

секундаimage, также не работает

третье изображение, успешное

im, используя python 3.7 с anaconda, tesseract v4.0.0.20181030 leptonica-1.76.0 libgif 5.1.4: libjpeg 8d (libjpeg-turbo 1.5.3): libpng 1.6.34: libtiff 4.0.9: zlib 1.2.11: libwebp 0.6.1: libopenjp2 2.2.0

1 Ответ

0 голосов
/ 28 января 2019

Вы можете найти обширную документацию по обучению tesseract-ocr здесь .

Единственная сложная часть обучения tesseract - это файлы коробок, которые я рекомендую использовать:

Tesseract-OCR Chopper

для создания коробочных файлов для обучения.

...