Проведите полдня, пытаясь найти лучший способ предварительной обработки изображения для оптического распознавания текста Тессеракта, и не нашли никаких хороших результатов, кроме порога.Кто-нибудь может подсказать, какие шаги мне следует попробовать?OpenCV, ImageMagick, Gimp подходят мне как инструментам, изображения могут иметь различный фон, но шрифт и цвет шрифта всегда будут одинаковыми.Вот примеры изображений:
-
Я получил что-то подобное в настоящее время, используя пороговые фильтры:
и текст из OCR вот так: "УСТРАНЕННЫЕ СРОКИ220_{¢ - \ "|«Vv a.- "