Я пытаюсь использовать tesseract-OCR через python-tesseract для чтения шрифта низкого разрешения, который выглядит следующим образом:
К сожалению, этоизображение возвращается
ZIJZHZI
Я думаю, что разрешение слишком низкое, и это вызывает проблемы.Я попытался увеличить изображение и обрезать его до отдельных символов, но ни один из них не дает большого улучшения.Есть ли что-то еще, что я должен рассмотреть, предпочтительно что-то, что можно сделать с помощью библиотеки изображений Python?Или я должен просто сдаться / обучить тессеракт.
Для чего стоит, PIL имеет следующие встроенные фильтры:
BLUR, CONTOUR, DETAIL, EDGE_ENHANCE,
EDGE_ENHANCE_MORE, EMBOSS, FIND_EDGES,
SMOOTH, SMOOTH_MORE и SHARPEN