вывод pytesseract такой странный без какой-либо ошибки - PullRequest
0 голосов
/ 03 июля 2018

enter image description here

import pytesseract

from PIL import Image, ImageEnhance, ImageFilter

pytesseract.pytesseract.tesseract_cmd="C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe"
im = Image.open("C:\\1.png") # the second one 
im = im.filter(ImageFilter.MedianFilter())
enhancer = ImageEnhance.Contrast(im)
im = enhancer.enhance(2)
im = im.convert('1')
im.save('temp2.png')
#im.show()
text = pytesseract.image_to_string(Image.open('temp2.png'),config='-psm 8')
print(text)

Привет всем

Я пытаюсь извлечь текст из изображения (капча), так что это код выше, я до сих пор кодирую. Я не думаю, что есть какие-либо проблемы, так как есть ошибка при запуске. но выход такой плохой.

когда я запускаю это, он ничего не показывает, но я меняю -psm 8 на -psm 5, он показывает '; «'.

Не могли бы вы дать мне совет, как это исправить?

1 Ответ

0 голосов
/ 03 июля 2018

Готово.

Я изменил другой рис для теста, и по крайней мере для этой картинки проблем не было.

но я думаю, что этот модуль слишком плохой ... будет лучше найти другой модуль ..

...