Как построить dataframe с LDA в Python - PullRequest
0 голосов
/ 27 ноября 2018

На основе 37 000 текстов статей я реализовал LDA mallet тематическое моделирование.Каждая статья была должным образом распределена по категориям, и была определена основная тема каждой из них.

Теперь я хочу создать фрейм данных, который показывает проценты каждой темы для каждой статьи в Python.

Я хочу, чтобы фрейм данных выглядел следующим образом:


no |      Text     | Topic_Num_1 | Topic_Num_2 | .... | Topic_Num_25
01 | article text1 |   0.7529    |   0.0034    | .... | 0.0011
02 | article text2 |   0.3529    |   0.0124    | .... | 0.0001

.... (строка 37000 x 27)

Как мне это сделать?

+

Весь код, который я делал, основан на следующем сайте.

http://machinelearningplus.com/nlp/topic-modeling-gensim-python

Как просмотреть список вероятностей для каждой статьи?

...