На основе 37 000 текстов статей я реализовал LDA mallet
тематическое моделирование.Каждая статья была должным образом распределена по категориям, и была определена основная тема каждой из них.
Теперь я хочу создать фрейм данных, который показывает проценты каждой темы для каждой статьи в Python.
Я хочу, чтобы фрейм данных выглядел следующим образом:
no | Text | Topic_Num_1 | Topic_Num_2 | .... | Topic_Num_25
01 | article text1 | 0.7529 | 0.0034 | .... | 0.0011
02 | article text2 | 0.3529 | 0.0124 | .... | 0.0001
.... (строка 37000 x 27)
Как мне это сделать?
+
Весь код, который я делал, основан на следующем сайте.
http://machinelearningplus.com/nlp/topic-modeling-gensim-python
Как просмотреть список вероятностей для каждой статьи?