Я пытался узнать о скрытых марковских моделях, но застрял с определенной проблемой. Я вычислил вероятность того, что наблюдаемая последовательность произведена данной моделью как:
P (O | λ) = ΣαT (i)
Я получил эту формулу и все остальные Я использовал статью Лоуренса Р. Рабинера от 1989 года, найденную под: https://www.ece.ucsb.edu/Faculty/Rabiner/ece259/Reprints/tutorial%20on%20hmm%20and%20applications.pdf
Кроме того, я посмотрел следующую статью, в которой основы HMM визуализируются довольно красиво: https://medium.com/@Ayra_Lux / hidden-markov-models-part-1-the-правдоподобия-проблема-8dd1066a784e
Моя проблема в том, что я не понимаю полученную вероятность, так как он уменьшается с более длинными последовательностями и составляет около 10 ^ -17 в моем случае и около 10 ^ -4 в вышеупомянутой статье. Означает ли это, что модель плохо предсказывает данные или вычисленное значение имеет обратную зависимость от производительности модели?
Насколько я понимаю, кажется, что низкое значение для P (O | λ) должно быть нежелательно, но, возможно, я неправильно истолковываю это.
Может ли кто-нибудь прояснить это для меня?
В каком диапазоне это значение должно быть в оптимальном случае?
Спасибо вам за ваши ответы!
Редактировать: чтобы проиллюстрировать эту точку зрения, я использовал последовательность A и B, где за A всегда следует B, и наоборот.
Пример: ABABABABABABABABABABABABABAB
Результирующие вероятности перехода должны быть: A-> B = 1, A-> A = 0 и B-> A = 1, B-> B = 0
Эти вероятности изучены быстро с помощью HMM, используя алгоритм Баума-Уэлча. Но если я суммирую по прямым вероятностям на последнем временном шаге (так что P (O | λ) = ΣαT (i)), полученное значение будет равно 0 или, по крайней мере, очень близко к нему.