Отрицательные значения: оцените Gensim LDA с согласованностью темы - PullRequest
0 голосов
/ 30 мая 2018

В настоящее время я пытаюсь оценить мои тематические модели с помощью gensim topiccoherencemodel:

from gensim.models.coherencemodel import CoherenceModel
cm_u_mass = CoherenceModel(model = model1, corpus = corpus1, coherence = 'u_mass')
coherence_u_mass = cm_u_mass.get_coherence()

print('\nCoherence Score: ', coherence_u_mass)

Вывод - только отрицательные значения.Это правильно?Кто-нибудь может предоставить формулу или что-то, как работает u_mass?

1 Ответ

0 голосов
/ 24 января 2019

Если взглянуть на оригинальную статью , вы увидите, что когерентность UMass рассчитывается по логарифму вероятностей, поэтому она отрицательна.

В отношении заданной вами формулы она можетнайдено как уравнение 4 в той же статье .

Я понимаю, что, когда значение согласованности UMass приближается к 0, согласованность тем становится лучше.

Надеюсь, это поможет.

...