Python Gensim LDA Model show_topics funciton - PullRequest
       30

Python Gensim LDA Model show_topics funciton

0 голосов
/ 26 февраля 2020

Я тренирую модель LDA с использованием Gensim:

dictionary = corpora.Dictionary(section_2_sentence_df['Tokenized_Sentence'].tolist())
dictionary.filter_extremes(no_below=20, no_above=0.7)
corpus = [dictionary.doc2bow(text) for text in (section_2_sentence_df['Tokenized_Sentence'].tolist())]

num_topics = 15
passes = 200
chunksize = 100
lda_sentence_model = gensim.models.ldamulticore.LdaMulticore(corpus, num_topics=num_topics, 
                                                              id2word=dictionary, 
                                                              passes=passes, 
                                                              chunksize=chunksize,
                                                              random_state=100,
                                                              workers = 3)

После обучения мне нужны темы для дальнейшего анализа. К сожалению, функция show_topics возвращает только 10 тем . Я ожидал определенного количества 15 тем . Кто-нибудь знает, намеренно ли это или ошибка, которая может быть решена?

print(len(lda_sentence_model.show_topics(formatted=False)))

1 Ответ

1 голос
/ 27 февраля 2020

В соответствии с документацией gensim для метода .show_topics() его значение параметра num_topics по умолчанию («Количество тем, подлежащих возврату») равно 10:

https://radimrehurek.com/gensim/models/ldamulticore.html#gensim .models. ldamulticore.LdaMulticore.show_topics

Если вы хотите, чтобы он возвращал больше 10, укажите предпочитаемое значение, отличное от значения по умолчанию, для параметра num_topics этого метода. Например:

len(lda_sentence_model.show_topics(formatted=False, num_topics=15))
...