Question

У меня есть простой текст на изображении image_ball.png.Обычно OCR Тессеракта работает хорошо, но для этого определенного изображения он всегда возвращает пустую строку.

In [1]: from PIL import Image

In [2]: from pytesseract import image_to_string

In [3]: img = Image.open("image_ball.png")

In [4]: image_to_string(img)
Out[5]: u''

Я не мог найти обходной путь до сих пор.Как я мог выяснить, что не так с этим изображением?

Версии:

In [6]: import PIL

In [7]: PIL.__version__
Out[7]: '4.0.0'


$ tesseract -v
tesseract 4.0.0
 leptonica-1.77.0
  libgif 5.1.4 : libjpeg 9c : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.2 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found SSE

РЕДАКТИРОВАТЬ

Я также пытался преобразоватьизображение в черно-белом.Но это все еще не распознано.

In [6]: image = img.convert('L') 

In [7]: image_to_string(image)
Out[8]: u''

РЕДАКТИРОВАТЬ 2

Отдельные символы также являются проблемой для Тессеракта.Расширение или размытие изображения, похоже, не поможет: image_1.png

Dmitrii Z. · Answer 1 · 07 февраля 2019

Расширяющее изображение дает желаемый результат.

image = cv2.imread("Ball.png", cv2.IMREAD_GRAYSCALE) 
cv2.dilate(image, (5, 5), image)
print(pytesseract.image_to_string(image), config='--psm 7')

Мяч

Тессеракт image_to_string пуст

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Тессеракт image_to_string пуст

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы