Топи c Номера (LDA-Gensim) - PullRequest
0 голосов
/ 09 июля 2020

Я выполнил топи c моделирование LDA с помощью gensim и распечатал каждое из основных слов для тем, используя код:

LDA = gensim.models.ldamodel.LdaModel(corpus=corpus,
                                       id2word=dictionary,
                                       num_topics=5, 
                                       random_state=100,
                                       update_every=1,
                                       chunksize=100,
                                       passes=10,
                                       alpha='auto',
                                       per_word_topics=True)
pprint(LDA.print_topics())
doc_lda = LDA[corpus]

Этот код был запущен на листе Excel, который я читал in, в частности, столбец с именем "text" (research ['text]). Теперь мне любопытно, как я могу добавить столбец в свой лист Excel, чтобы указать, какой номер topi c соответствует соответствующей ячейке, помимо чего-то вроде этого:

   Name     Text              Topic
   bob      walked the dog      2
   chris    with the cat        3
...