Как описано в моем предыдущем сообщении , я реализовал DMR с помощью API-интерфейса Mallet JAVA. Но, похоже, я все еще застрял в интерпретации сгенерированных результатов.
Моя цель - отслеживать (и визуализировать) актуальность топи c в разные годы публикаций.
Например, topi c 3 отражает террористические акты в Париже. Эта трагедия произошла в 2015 году.
Как описано в предыдущем посте, числовые значения после нескольких лет представляют собой коэффициенты регрессии, которые отражают влияние год на данном топи c (наверное?). Это имело бы смысл, потому что коэффициент намного выше в 2015 году, чем где-либо еще.
Числовые значения c после коэффициентов регрессии должны быть в процентах ... чего? Я рассчитал их, основываясь на моем понимании ответа г-на Мимно в предыдущем посте, следующим образом:
(Math.exp(defaultValue + weight) / Math.exp(defaultValue))
Это соотношение между значением по умолчанию и спецификацией функции c Параметры Дирихле , Я полагаю? Если да, то почему значение на 2015 год 117% ? И что определяет это значение?
Q1: Как эти значения можно интерпретировать для отслеживания актуальности специфики c topi c по годам?
Q2: Имеет ли смысл этот расчет? Или, другими словами: какую информацию можно извлечь из этого процента?