Как можно использовать HMM для распознавания рукописного ввода? - PullRequest
5 голосов
/ 22 февраля 2012

Проблема немного отличается от традиционного распознавания рукописного ввода. У меня есть набор данных, которые тысячи следующих. Для одного нарисованного символа у меня есть несколько последовательных (x, y) координат, где ручка была нажата. Итак, это очередная (временная) проблема.

Я хочу иметь возможность классифицировать рукописные символы на основе этих данных и хотел бы использовать HMM для обучения. Но правильный ли это подход? Как их можно использовать для этого?

Ответы [ 2 ]

3 голосов
/ 14 июля 2012

Я думаю, что HMM можно использовать в обеих задачах, упомянутых @jens. Я тоже работаю над почерком в Интернете, и HMM используется во многих статьях. Самый простой подход такой:

  1. Выберите функцию.
  2. Если выбранная функция непрерывна, преобразуйте ее в дискретную.
  3. Выберите параметры HMM: топология и число состояний.
  4. Тренировка моделей персонажей с использованием HMM. одна модель для каждого класса.
  5. Тестирование с использованием тестового набора.

за каждый предмет:

  1. самая простая особенность - это угол вектора, который соединяет точки. Вы можете использовать более сложные функции, такие как углы векторов получено по алгоритму Дугласа и Пекера.
  2. Простейшим способом дискретизации является использование кодов Фримена, но Также можно использовать алгоритмы кластеризации, такие как k-means и GMM.
  3. Топологии HMM: эргодическая, левая-правая, Bakis и линейная. Количество штатов может быть получен методом проб и ошибок. Параметры HMM могут быть переменными для каждая модель. Количество наблюдений определяется дискретизацией. образцы наблюдения могут иметь переменную длину.
  4. Я рекомендую Kevin Murphy HMM toolbox.
  5. Удачи.
2 голосов
/ 04 марта 2012

Эта проблема на самом деле представляет собой смесь двух проблем:

  1. распознавание одного символа из ваших данных
  2. распознавание слова из (шумной) последовательности символов

HMM используется для нахождения наиболее вероятной последовательности конечного числа дискретных состояний из зашумленных измерений. Это как раз проблема 2, поскольку зашумленные измерения дискретных состояний a-z, 0-9 следуют друг за другом в последовательности.

Для задачи 1 HMM бесполезен, потому что вас не интересует базовая последовательность. Вам нужно дополнить свою рукописную цифру информацией о том, как вы ее написали.

Лично я бы начал с внедрения регулярного современного распознавания рукописного ввода, которое уже очень хорошо (с помощью сверточных нейронных сетей или глубокого обучения). После этого вы можете добавить информацию о том, как она была написана, например по часовой стрелке / против часовой стрелки.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...