Преобразование Хафа для линий находит уравнения наилучшего соответствия линии. Вам нужно будет выполнить дополнительную обработку, чтобы найти только отрезки. Если толщина символа составляет несколько пикселей, то для эффективного поиска линий вы можете уменьшить толщину до одного пикселя. Для этого есть методы, но есть и различные алгоритмические ловушки.
После того, как у вас есть отрезки, вам все равно придется написать алгоритм для идентификации символов на основе относительного положения и угла отрезков. Это сложнее, чем кажется на первый взгляд.
Нормализованная взаимная корреляция (сопоставление с шаблоном) может работать, если вы уверены, что изображение всегда будет в определенном повороте, символы всегда будут одинакового размера и т. Д. Но даже для сканов вы увидите некоторые вращение и некоторые изменения в контрасте.
Все это, кроме всего прочего, в долгосрочной перспективе, вероятно, дешевле использовать коммерческий пакет OCR или достаточно хороший проект с открытым исходным кодом. OCR сложно реализовать, если вы еще не знакомы с обработкой изображений.