У меня есть следующие изображения:
img01.png
![img01.png](https://i.stack.imgur.com/bSO87.png)
img02.png
![img02.png](https://i.stack.imgur.com/gizBw.png)
Когда я запускаю tesseract img01.png img01.txt -l eng --psm 7
, я получаю тексты
7.819 0
для первого изображения и 10.024
для второй.
Второй результат верный. Однако на первом изображении это o
, а не ноль.
Как заставить Тессеракт распознавать o как o?
Обновление 1: I попытался использовать опцию --oem 1
, как предложено в этого ответа (tesseract --oem 1 img01.png img01-ocred -l eng --psm 7
), но это не помогло.
Обновление 2: Бинаризация изображения с помощью magick img01.png +dither -colors 3 -colors 2 -colorspace gray -normalize img01-binarized.png
тоже не помогло. бинаризованное изображение выглядит так:
![img01-binarized.png](https://i.stack.imgur.com/bMSg3.png)