Отслеживание релевантности topi c с использованием DMR - Трудности интерпретации - PullRequest
0 голосов
/ 19 марта 2020

Как описано в моем предыдущем сообщении , я реализовал DMR с помощью API-интерфейса Mallet JAVA. Но, похоже, я все еще застрял в интерпретации сгенерированных результатов.

Моя цель - отслеживать (и визуализировать) актуальность топи c в разные годы публикаций.

Например, topi c 3 отражает террористические акты в Париже. Эта трагедия произошла в 2015 году.

enter image description here

Как описано в предыдущем посте, числовые значения после нескольких лет представляют собой коэффициенты регрессии, которые отражают влияние год на данном топи c (наверное?). Это имело бы смысл, потому что коэффициент намного выше в 2015 году, чем где-либо еще.

Числовые значения c после коэффициентов регрессии должны быть в процентах ... чего? Я рассчитал их, основываясь на моем понимании ответа г-на Мимно в предыдущем посте, следующим образом:

(Math.exp(defaultValue + weight) / Math.exp(defaultValue))

Это соотношение между значением по умолчанию и спецификацией функции c Параметры Дирихле , Я полагаю? Если да, то почему значение на 2015 год 117% ? И что определяет это значение?

Q1: Как эти значения можно интерпретировать для отслеживания актуальности специфики c topi c по годам?

Q2: Имеет ли смысл этот расчет? Или, другими словами: какую информацию можно извлечь из этого процента?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...