Как уже упоминал Кенни, «маркировка подключенных компонентов» описывает семейство алгоритмов, которые идентифицируют подключенные пиксели. Связанные компоненты также называются «соединенными областями» или «каплями», а также связанным понятием «контуры». Любой такой алгоритм должен иметь возможность находить не только форму связанных пикселей переднего плана, но также наличие «дырок» внутри фигуры, состоящей из пикселей цвета фона.
http://en.wikipedia.org/wiki/Connected-component_labeling
Этот алгоритм используется для нескольких инженерных областей, которые зависят от обработки изображений, включая компьютерное зрение, машинное зрение и медицинскую визуализацию. Если вы собираетесь потратить какое-то время на обработку изображений, вам следует освоиться с этим алгоритмом и реализовать его хотя бы один раз.
Библиотека OpenCV имеет функцию findContours (), которую можно использовать для поиска контуров, контуров внутри контуров и т. Д.
http://opencv.willowgarage.com/wiki/
Если вы хотите увидеть работающий алгоритм маркировки региона, поищите ссылки на «подсчет ячеек» с помощью приложения ImageJ. Подсчет биологических клеток является важным и часто упоминаемым применением маркировки регионов для медицинской визуализации.
http://rsbweb.nih.gov/ij/
Подумайте о том, чтобы получить учебник по этому предмету, а не изучать его по частям. Изучение связанных компонентов (например, капли) неизбежно приводит к рассмотрению бинаризации (определение порога), которая берет изображение в градациях серого или цветное изображение и генерирует черно-белое изображение из него. Если вы работаете с изображениями с камеры, то освещение становится критически важным, и для обучения требуются время и работа.
Существует множество других шагов предварительной обработки, которые могут потребоваться для очистки изображения. Необходимость предварительной обработки зависит от вашего приложения.
Вот учебник, который часто рекомендуется и который дает хорошее представление о стандартных методах обработки изображений:
Цифровая обработка изображений Гонсалес и Вудс, 3-е издание
http://www.imageprocessingplace.com/
Зайдите на addall.com, чтобы найти дешевые копии. Международные издания дешевле.
Если символы (или другие фигуры) на изображении имеют одинаковый размер и форму - например, буква «А» всегда имеет высоту 40 пикселей и 25 пикселей и печатается на машине одним и тем же шрифтом - тогда вы можете используйте метод «нормализованной взаимной корреляции» или сопоставления с шаблоном, чтобы определить наличие одной или нескольких совпадающих фигур. Этот метод может работать как очень грубый тип OCR, но имеет серьезные ограничения.
http://en.wikipedia.org/wiki/Template_matching