Java Распределение ключевых слов Маллет LDA - PullRequest
0 голосов
/ 27 февраля 2020

Я использовал Java -Mallet API для топи c моделирования с LDA. API выдает следующие результаты: topi c: ключевое слово1 (число), ключевое слово2 (число)

Например,

topi c 0: файл (12423), тест (3123). .. topi c 1: класс (2415), тест (314) ...

Правильно ли, что topi c 0 = файл (12423/12423 + 3123 ....), тест (3123/12423 + 3123).

1 Ответ

0 голосов
/ 28 февраля 2020

Это один из способов оценки вероятностей. Вы также можете добавить параметр сглаживания (обычно 0,01) к каждому значению и добавить 0,01 от размера словаря к знаменателю, чтобы он составлял 1,0.

...