Как преобразовать специальный текст шрифта в изображении в строку в Python - PullRequest
0 голосов
/ 09 марта 2019

Приведенный ниже код преобразует текст изображения в строку, но он не точен, некоторые специальные символы находятся между sampe image

from PIL import Image
import pytesseract

image=Image.open('C://Users/Arjun/Desktop/1512350.jpg')
pytesseract.pytesseract.tesseract_cmd='C://Program Files (x86)/Tesseract- 
OCR/tesseract'
result=pytesseract.image_to_string(image,config='-psm7 -c 
tessedit_char_whitlist=ABCDEFGHIJKLMNOPQRSTUVWXYZ01234567890')
print(result)

вывод:

fl / 'S'TIW ° MILLER' 1003055666 ° смол / 71;C6521: pmuzznmmimfmmpmy * 5 мг [эл.- I'Va: / 11 / £ 172 'J6' 19955,65 * 5685,26 "4586,65 'Safaxizf

1 Ответ

0 голосов
/ 12 марта 2019

@ Арджун, я думаю, вместо прямой передачи изображения, попробуйте применить некоторые операции с изображением для получения лучших результатов.Попробуйте применить порог, например, двоичный порог, адаптивный порог, порог Otsu_binary, а затем попытайтесь получить результат.Я думаю, что это может дать вам точный результат и дать мне знать, если вы застряли.Спасибо

Вы можете сослаться на эту ссылку, чтобы понять, как лучше использовать методы Threshold Threshold Doc

...