Я новичок в программировании на Python и сталкиваюсь с проблемами, пытаясь применить LDA (скрытое распределение дирихлетов) к набору данных в Python.набор данных содержит информацию о журнальных работах, и я применяю LDA к этому набору данных
Вот
self.common_dictionary = Dictionary(common_texts)
self.common_corpus = [self.common_dictionary.doc2bow(all_clean_text) for all_clean_text in common_texts]
self.lda = models.LdaModel(self.common_corpus, num_topics=20, id2word = self.common_dictionary, per_word_topics=True)
Вот мое примерное описание входного файла (CSV)
abstract || n_citation || title || venue
LDA не дает правильного вывода. Я уже предварительно обработал данные. Моя последняя задача - рекомендовать место проведения на основе введенного заголовка и тезисов.