извлечь код из изображения, которое имеет шум от линий и кривых - PullRequest
0 голосов
/ 20 июня 2019

Я пытаюсь извлечь код из прикрепленного изображения, используя python и tesseract. Однако мои попытки не увенчались успехом. Я смог продвинуться только с помощью следующего кода.

код:

def get_captcha_text(self):        
    self.im = Image.open(self.PATH)
    self.im = self.im.filter(ImageFilter.MedianFilter()) # blur the image, the stripes will be erased
    self.im = ImageEnhance.Contrast(self.im).enhance(2)  # increase the contrast (to make image clear?)
    self.im = self.im.convert('1')                       # convert to black-white image
    self.im.save(self.PATH)
    self.text = image_to_string(self.im, config ="--psm 11 -c tessedit_char_whitelist=0123456789abcdfghijkmnlopqrsturstuvwxyzABCDEFGHIJKMNLOPQRSTUVWXYZ")
    print ("text={}".format(self.text))

Изображение:

Посмотреть изображение здесь

Результат: qjm

Можете ли вы предложить какой-нибудь код для очистки изображения и извлечения информации без проблем?

...