Я использую Pytesseract версии 0.3.2 и должен ограничить его символы английским sh алфавитом (не заглавными) и цифрами. Ниже приведен мой код:
pytesseract.image_to_string(some_image, lang = 'eng' ,config="--psm 6 --oem 0 tessedit_char_whitelist=0123456789abcdefghijklmnopqrstuvwxyz")
Я попытался не только tessedit_char_whitelist, но и изменил конфигурационный файл в tesseract, но ни один из них не сработал!
Строка внутри рисунка "4p6dgi" но pytesseract выводит "4p6 ¢ gi". Я думаю, что '¢' должен быть специальным символом !!!!
Кто-нибудь знает, как решить эту проблему?
Заранее прошу прощения за язык ошибки и любые другие проблемы.
СПАСИБО