Я выполнил топи c моделирование LDA с помощью gensim и распечатал каждое из основных слов для тем, используя код:
LDA = gensim.models.ldamodel.LdaModel(corpus=corpus,
id2word=dictionary,
num_topics=5,
random_state=100,
update_every=1,
chunksize=100,
passes=10,
alpha='auto',
per_word_topics=True)
pprint(LDA.print_topics())
doc_lda = LDA[corpus]
Этот код был запущен на листе Excel, который я читал in, в частности, столбец с именем "text" (research ['text]). Теперь мне любопытно, как я могу добавить столбец в свой лист Excel, чтобы указать, какой номер topi c соответствует соответствующей ячейке, помимо чего-то вроде этого:
Name Text Topic
bob walked the dog 2
chris with the cat 3