Topi c Согласованность со словарем из перчатки (gensim) - PullRequest
0 голосов
/ 25 марта 2020

Я пытаюсь оценить самодельную модель топи c. Для этого я использую список тем (представленных ключевыми словами) и хочу использовать gensim.models.coherencemodel.CoherenceModel и вызывать его в корпусе, представляющем собой список строк (каждая из которых является документом). Для CoherenceModel требуется Dictionary, но я не понимаю, что это соответствует и как я могу его получить. Я использую TfidfVectorizer из sklearn для векторизации текста и glove встраивания из gensim для вычисления сходства в моей модели.

1 Ответ

0 голосов
/ 25 марта 2020

Из документов можно создать Dictionary из корпуса, где корпус - list of lists of str. Этот же корпус должен быть передан в аргументе text CoherenceModel.

...