Улучшение точности распознавания текста в Tesseract на скриншоте - PullRequest
0 голосов
/ 19 июня 2019

Тессеракт OCR на скриншотах дает довольно ошибочные результаты.Кажется, что только часть текста распознается правильно, даже если изображение полностью черное с белым текстом на нем.Даже после того, как я изменил размер изображения до 300dpi, точность остается низкой, и большая часть текста является бессмысленной.

Я прочитал аналогичный вопрос в StackOverflow по адресу: Лучший способ распознать символы на скриншоте?

Как уже упоминалось, автор вопроса смог добиться почти 100% точности, обучив движок тессеракта своим шрифтом.

Шрифт на моем изображении - Arial.Как я могу еще улучшить точность ???

Вот пример того типа изображений, которые у меня есть: Образец изображения

1 Ответ

1 голос
/ 19 июня 2019

Вы можете поиграть с конфигурацией OCR, изменив значения --psm и --oem

попробовать: - PSM 5 --oem 2

вы также можете посмотреть следующую ссылку для получения более подробной информации здесь

...