Проблема применения LDA для набора данных для рекомендации - PullRequest
0 голосов
/ 17 февраля 2019

Я новичок в программировании на Python и сталкиваюсь с проблемами, пытаясь применить LDA (скрытое распределение дирихлетов) к набору данных в Python.набор данных содержит информацию о журнальных работах, и я применяю LDA к этому набору данных

Вот

 self.common_dictionary = Dictionary(common_texts)
self.common_corpus = [self.common_dictionary.doc2bow(all_clean_text) for all_clean_text in common_texts]
self.lda = models.LdaModel(self.common_corpus, num_topics=20, id2word = self.common_dictionary, per_word_topics=True)

Вот мое примерное описание входного файла (CSV)

abstract || n_citation || title || venue

LDA не дает правильного вывода. Я уже предварительно обработал данные. Моя последняя задача - рекомендовать место проведения на основе введенного заголовка и тезисов.

...