У меня есть простой текст на изображении image_ball.png
.Обычно OCR Тессеракта работает хорошо, но для этого определенного изображения он всегда возвращает пустую строку.![image_ball.png](https://i.stack.imgur.com/zhPwO.png)
In [1]: from PIL import Image
In [2]: from pytesseract import image_to_string
In [3]: img = Image.open("image_ball.png")
In [4]: image_to_string(img)
Out[5]: u''
Я не мог найти обходной путь до сих пор.Как я мог выяснить, что не так с этим изображением?
Версии:
In [6]: import PIL
In [7]: PIL.__version__
Out[7]: '4.0.0'
$ tesseract -v
tesseract 4.0.0
leptonica-1.77.0
libgif 5.1.4 : libjpeg 9c : libpng 1.6.36 : libtiff 4.0.10 : zlib 1.2.11 : libwebp 1.0.2 : libopenjp2 2.3.0
Found AVX2
Found AVX
Found SSE
РЕДАКТИРОВАТЬ
Я также пытался преобразоватьизображение в черно-белом.Но это все еще не распознано.
In [6]: image = img.convert('L')
In [7]: image_to_string(image)
Out[8]: u''
РЕДАКТИРОВАТЬ 2
Отдельные символы также являются проблемой для Тессеракта.Расширение или размытие изображения, похоже, не поможет: image_1.png
![image_1.png](https://i.stack.imgur.com/2Q8OV.png)