Определение начала и конца вектора XY символов на изображении - PullRequest
0 голосов
/ 26 сентября 2011

Я пытаюсь вспомнить некоторую информацию о письмах, чтобы начать какое-то распознавание текста с помощью нейронных сетей.Мне еще предстоит объединить все вещи вместе, однако проблема, с которой я сейчас сталкиваюсь, заключается в том, как разделить персонажей и разделить их.Что-то вроде http://pp19dd.com/tesseract-ocr-chopper/?i=ocrFTYzRJ (ничего необычного, только обычные шрифты)

Я считаю, что лучший способ - создать большое количество циклов for, чтобы получить верхний, нижний x и y с учетом каждого символа и числаесть черные пиксели, которые соединяют друг с другом (хотя я - исключение).

Есть ли какая-либо библиотека или алгоритм, который может помочь мне в этом?Я использую Cimg для обработки изображений.

Это действительно сложно?

Ответы [ 2 ]

1 голос
/ 26 сентября 2011

Звучит так, будто вы ищете этикетировщик подключенных компонентов.Идея состоит в том, чтобы отсканировать изображение для групп пикселей, которые связаны друг с другом, и вернуть коллекцию объектов (обычно называемых «BLOB-объектами»), где каждый объект содержит список пикселей в этом BLOB-объекте.

Я не рекомендую пытаться писать самостоятельно.OpenCV имеет один встроенный, который работает очень хорошо и основан на

F.Chang, C.-J.Chen, andC.-J.Lu, "Алгоритм маркировки компонентов с линейным временем с использованием техники трассировки контуров«Компьютерное зрение и понимание изображений», вып.93, нет.2, с. 206–220, 2004.

Очень может быть лучшее решение, специально предназначенное для поиска букв.

0 голосов
/ 26 сентября 2011

Вы проверяли проект OpenCV ? Здесь - учебник по выполнению числового распознавания текста.

...