Звучит так, будто вы ищете этикетировщик подключенных компонентов.Идея состоит в том, чтобы отсканировать изображение для групп пикселей, которые связаны друг с другом, и вернуть коллекцию объектов (обычно называемых «BLOB-объектами»), где каждый объект содержит список пикселей в этом BLOB-объекте.
Я не рекомендую пытаться писать самостоятельно.OpenCV имеет один встроенный, который работает очень хорошо и основан на
F.Chang, C.-J.Chen, andC.-J.Lu, "Алгоритм маркировки компонентов с линейным временем с использованием техники трассировки контуров«Компьютерное зрение и понимание изображений», вып.93, нет.2, с. 206–220, 2004.
Очень может быть лучшее решение, специально предназначенное для поиска букв.