распознавание объектов сложно, потому что любой простой алгоритм, как правило, будет способ слишком медленным, как вы, вероятно, поняли.
К счастью, если у вас довольно большая коллекцияэти изображения под рукой, которые уже правильно помечены, тогда у меня есть очень простое решение для вас.
Просто создайте 3-слойную сеть с прямой связью с одним входным блоком на пиксель, каждый из которых подключается к гораздо меньшему скрытому слою,и затем те, в свою очередь, подключаются к 1 выходному блоку (представляющему, какой символ присутствует на изображении).Затем просто запустите алгоритм обратного распространения в вашем наборе данных, пока сеть не научится распознавать символы.
К сожалению, это не очень хорошо масштабируется, поэтому вам, возможно, придется поискать сверточные NNs длялучшая производительность.
Кроме того, если у вас нет тренировочных данных (т. е. помеченных примеров), то, вероятно, лучше всего разбить символы на функции, а затем развернуть изображение для них.Если вы можете разложить их на строки, то преобразование может сделать это довольно быстро.