Как использовать алгоритм Geneti c в моделировании LDA topi c - PullRequest
0 голосов
/ 06 августа 2020

Я использую LDA topi c моделирование в текстовых данных, как использовать GA для настройки параметров модели LDA ??

def dominant_topic(ldamodel, corpus, texts):    
sent_topics_df = pd.DataFrame() 
 # Get main topic in each review
for i, row in enumerate(ldamodel[corpus]):
    row = sorted(row, key=lambda x: (x[1]), reverse=True)
     # Get the Dominant topic, Perc Contribution and Keywords for each review
    for j, (topic_num, prop_topic) in enumerate(row):
        if j == 0:  # => dominant topic
            wp = ldamodel.show_topic(topic_num,topn=4)
            topic_keywords = ", ".join([word for word, prop in wp])
            sent_topics_df = sent_topics_df.append(pd.Series([int(topic_num), round(prop_topic,4), topic_keywords]), ignore_index=True)
        else:
             break
sent_topics_df.columns = ['Dominant_Topic', 'Perc_Contribution', 'Topic_Keywords']
contents = pd.Series(texts)
sent_topics_df = pd.concat([sent_topics_df, contents], axis=1)
return(sent_topics_df)
...