Почему Tesseract OCR использует бинаризацию Оцу? - PullRequest
2 голосов
/ 24 июня 2019

Почему в движке Tesseract OCR используется глобальный метод определения пороговых значений, такой как бинаризация Оцу? Разве местные методы определения порога (например, Sauvola, Niblack и т. Д.) Не более эффективны для исключения текста из изображений?

Ответы [ 2 ]

1 голос
/ 24 июня 2019

В основном, в зависимости от входного изображения, нам нужно выбрать, какой алгоритм порога использовать.Tesseract использует метод Otsu для определения порога, потому что обычно вход в Tesseract для извлечения текста имеет однородность изображения.Метод Оцу эффективен и достаточно хорош для таких изображений.

Глобальный метод определения порога полезен и достаточно хорош, когда фон не показывает локальных изменений относительно интенсивности переднего плана (цели).Хотя локальный порог необходим, когда между разницей интенсивности фона и цели происходят локальные изменения.

Итак, в то время как Tesseract действительно использует метод Otsu (глобальный порог) для преобразования в двоичную форму, вы можете предварительно обработать изображение локальнымметоды порогового значения, чтобы получить лучший результат от Tesseract.

0 голосов
/ 24 июня 2019

Тессеракт использовался в книжном проекте Google, и AFAIK проводили тесты на лучшую бинаризацию, а Оцу был самым универсальным. Если Otsu не подходит для вашего случая, вы можете использовать другой алгоритм бинаризации перед отправкой изображения в tesseract.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...