Латентное распределение Дирихле (LDA) Генерация тем - PullRequest
0 голосов
/ 25 марта 2020

Недавно я следил за https://github.com/noahweber1/datacamp-project-The-Hottest-Topics-in-Machine-Learning/blob/master/notebook.ipynb, чтобы понять больше о LDA. В основном он использует LDA, чтобы найти самые горячие топи c в Машинном обучении из paper.csv (NIP paper)

Что меня смутило, так это последний вывод, топи c, найденные через LDA.

LDA output

  • Топи c # 0, например, для какого документа / строки из paper.csv?
  • Все ли эти слова в топи c взаимосвязаны?
  • Появляется ли слово во всех этих Топи c - самые горячие топи c или только Топи c # 0 - самые горячие топи c?
  • Топи c Создано не предложение верно?

1 Ответ

1 голос
/ 25 марта 2020

Я нашел ответ.

  1. Topi c # 0, например, для какого документа / строки из paper.csv?

Темы - это просто «категории». Вы должны определить это.

Все ли эти слова в Топи c взаимосвязаны?

Да, они связаны. Вот как они генерируются.

Появляется ли слово во всех этих Топи c - самые горячие топи c или только Топи c # 0 - самые горячие топи c?

Это не скажу вам, какая из топи c самая горячая, но обычно топи c # 0 в данном случае является ответом, так как он относится ко всем документам

Созданные топи c не являются правильным предложением?

Нет, модель генерирует слово.

Больше понять концепцию можно можно найти здесь .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...