Тематическое моделирование с использованием LDA - PullRequest
0 голосов
/ 17 июня 2019

При определении корпуса и словаря для построения модели LDA путем определения тем, как мы можем использовать ключевые слова для разных тем

Он работает, когда явно указан номер темы, но я хочу, чтобы это повторилось.

Подготовка словаря и корпуса

from gensim import corpora

dictionary = corpora.Dictionary(doc_clean)

corpus = [dictionary.doc2bow(doc) for doc in doc_clean]

Здание LDA Модель

lda_model = gensim.models.ldamodel.LdaModel(corpus = corpus , id2word=dictionary , num_topics=10 , random_state=100, update_every=1 , chunksize=100 , passes=10 , alpha='auto' , per_word_topics=True)

Печать ключевых слов в темах

topics = print(lda_model.print_topic(6))

doc_lda = lda_model[corpus]

Я хочу знать, как мы можем повторять темы вместо того, чтобы каждый раз указывать номер темы вручную

1 Ответ

0 голосов
/ 17 июня 2019

Если я правильно понял ваш вопрос, все, что вам нужно, это:

topics = []
num_topics=10
for i in range((num_topics)):
    topics.append(lda_model.print_topic(i+1))
...