Привет, я учусь машинному обучению, и я хочу написать простое программное обеспечение для распознавания рукописного ввода с python и opencv.
для простоты, теперь я собираюсь распознавать только заглавные слова одного размераЯ думаю, что хороший способ распознать буквы - это использовать алгоритм ожидания-максимизации для изучения параметров модели гауссовой смеси, использовать обучающий набор и сравнивать новые буквы гауссовой смеси с обученными.но я не понимаю, как выбрать, сколько гауссов в смеси.
Вторая проблема заключается в том, как понять, сколько слов на странице и сколько букв в слове.я не думаю, что em-алгоритм или аналог (например, k-means) может быть решением, но наверняка есть некоторые проблемы с сегментацией
несколько советов?