Тессеракт читает неправильные символы - PullRequest
0 голосов
/ 23 июня 2019

Я использую тессеракт для извлечения текста из изображений.Всякий раз, когда у меня низкий уровень достоверности, я снова запускаю тессеракт для этого слова.

Но в некоторых случаях символы разбиваются между ними.Я попробовал другую комбинацию, но не получил никакого результата для этого.Как и this image

img=img.resize([img.width*2,img.height*2])
img=ImageEnhance.Brightness(img).enhance(3.0)    
pytesseract.image_to_data(img,output_type=Output.DICT,config='--psm 10')

Кроме того, есть много слов с черными пятнами между ними.Есть ли библиотека, которая может улучшить черные пятна, или я должен использовать только OpenCV.

...