Эта проблема на самом деле представляет собой смесь двух проблем:
- распознавание одного символа из ваших данных
- распознавание слова из (шумной) последовательности символов
HMM используется для нахождения наиболее вероятной последовательности конечного числа дискретных состояний из зашумленных измерений. Это как раз проблема 2, поскольку зашумленные измерения дискретных состояний a-z, 0-9 следуют друг за другом в последовательности.
Для задачи 1 HMM бесполезен, потому что вас не интересует базовая последовательность. Вам нужно дополнить свою рукописную цифру информацией о том, как вы ее написали.
Лично я бы начал с внедрения регулярного современного распознавания рукописного ввода, которое уже очень хорошо (с помощью сверточных нейронных сетей или глубокого обучения). После этого вы можете добавить информацию о том, как она была написана, например по часовой стрелке / против часовой стрелки.