Как предсказать темы запроса, используя матрицу слово-тема? - PullRequest
0 голосов
/ 26 апреля 2018

Я реализую LDA с использованием Java. Я знаю, как работает алгоритм. В конце обучения (данные итерации) я получу 2 матрицы (topic-word и document-topic), которые представляют набор входных документов.

Моя проблема в том, что при вводе нового документа (запроса) я хочу использовать эти матрицы (или любым другим способом), чтобы получить вектор темы документа для этого запроса. Как бы я это сделал?

1 Ответ

0 голосов
/ 11 мая 2018

Используете ли вы вариационный вывод или выборку Гиббса?

Для выборки Гиббса типичным подходом является добавление нового документа (ов) к выводу и только обновление собственных счетчиков, поддерживая постоянными счетчики для документов, которые вы использовали для изучения модели.

Это указано в уравнениях 84 и 85 в Оценка параметров для анализа текста

Полагаю, в VI LDA должен быть похожий подход.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...