Pytesseract распознает буквы неправильно - PullRequest
0 голосов
/ 06 апреля 2020

Вот изображение https://i.imgur.com/icuV1eQ.png, из которого я хочу извлечь код: "GZQ". Вот мой код из Google Collab https://colab.research.google.com/drive/1GQhc8ObS9oihF7fUy2BNE0-x1guxBjvF#scrollTo = rMaOeCSFWnyA

!sudo apt install tesseract-ocr
!pip install pytesseract
import pytesseract
import shutil
import os
import random
try:
 from PIL import Image
except ImportError:
 import Image
imageurl="icuV1eQ.png"
!wget https://i.imgur.com/icuV1eQ.png
extractedInformation = pytesseract.image_to_string(Image.open(imageurl))
print(extractedInformation)

Это дает неправильный результат: "G yA Q" вместо "GZQ" Что я пробовал: преобразование PNG в JPG , обрезая изображение во многих отношениях, поэтому он показывает только код. Я также попробовал некоторые параметры конфигурации: --- PSM 1,3,5,7,9 - все дает еще худшие результаты. Помогите пожалуйста

...