Как получить список слов для каждой темы в pyLDAvis - PullRequest
0 голосов
/ 09 ноября 2018

Я новичок в использовании pyLDAvis. Я просматривал документацию, но не могу найти способ получить набор слов для каждой темы моей модели. У меня есть 20 тем, и я хотел бы получить около 20 слов для каждой темы. У кого-нибудь есть способ получить эти данные?

1 Ответ

0 голосов
/ 04 декабря 2018

Метод pyldavis.prepare() создает объект PreparedData с такими атрибутами, как .topic_info, который возвращает DataFrame со словами logprob и т. Д. (См. документы )

from pyLDAvis.gensim import prepare
vis = prepare(lda_model, corpus, dictionary, mds='tsne')
vis.topic_info

     Category         Freq       Term        Total  loglift  logprob
term                                                                
2299  Default 2,068,609.00      order 2,068,609.00    30.00    30.00
1037  Default   816,951.00      drink   816,951.00    29.00    29.00
2778  Default   565,075.00     review   565,075.00    28.00    28.00
...