Тематическое моделирование: LDA и BTM - PullRequest
0 голосов
/ 15 января 2019

Кто-нибудь знает здесь о моделировании темы? Мне очень нужна помощь.

1) Что такое тематическое моделирование 2) Что такое скрытое распределение дирихле и тематическое моделирование битерм? 3) В чем разница между LDA и BTM? 4) Как они работают?

Я нашел исследования, но не могу понять некоторые из них, особенно BTM, который очень мало можно найти (даже в YouTube, не могу найти учебник).

Большое вам спасибо.

1 Ответ

0 голосов
/ 18 января 2019

BTM - для кластеризации короткого текста (например, ответы на опрос, данные в твиттере, короткие предложения), LDA - для кластеризации длинного текста (например, новостные статьи, целые статьи). BTM кластеризует словосочетания, LDA кластеризует текстовые документы. Если вы в R,

Обе показанные ссылки содержат ссылки на математику в статьях

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...