Скрытые марковские модели. Как вы оцениваете вероятность того, что данная последовательность наблюдений получена с помощью конкретной c модели? - PullRequest
0 голосов
/ 19 января 2020

Я пытался узнать о скрытых марковских моделях, но застрял с определенной проблемой. Я вычислил вероятность того, что наблюдаемая последовательность произведена данной моделью как:

P (O | λ) = ΣαT (i)

Я получил эту формулу и все остальные Я использовал статью Лоуренса Р. Рабинера от 1989 года, найденную под: https://www.ece.ucsb.edu/Faculty/Rabiner/ece259/Reprints/tutorial%20on%20hmm%20and%20applications.pdf

Кроме того, я посмотрел следующую статью, в которой основы HMM визуализируются довольно красиво: https://medium.com/@Ayra_Lux / hidden-markov-models-part-1-the-правдоподобия-проблема-8dd1066a784e

Моя проблема в том, что я не понимаю полученную вероятность, так как он уменьшается с более длинными последовательностями и составляет около 10 ^ -17 в моем случае и около 10 ^ -4 в вышеупомянутой статье. Означает ли это, что модель плохо предсказывает данные или вычисленное значение имеет обратную зависимость от производительности модели?

Насколько я понимаю, кажется, что низкое значение для P (O | λ) должно быть нежелательно, но, возможно, я неправильно истолковываю это.

Может ли кто-нибудь прояснить это для меня?

В каком диапазоне это значение должно быть в оптимальном случае?

Спасибо вам за ваши ответы!

Редактировать: чтобы проиллюстрировать эту точку зрения, я использовал последовательность A и B, где за A всегда следует B, и наоборот.

Пример: ABABABABABABABABABABABABABAB

Результирующие вероятности перехода должны быть: A-> B = 1, A-> A = 0 и B-> A = 1, B-> B = 0

Эти вероятности изучены быстро с помощью HMM, используя алгоритм Баума-Уэлча. Но если я суммирую по прямым вероятностям на последнем временном шаге (так что P (O | λ) = ΣαT (i)), полученное значение будет равно 0 или, по крайней мере, очень близко к нему.

...