Я пытаюсь оценить самодельную модель топи c. Для этого я использую список тем (представленных ключевыми словами) и хочу использовать gensim.models.coherencemodel.CoherenceModel
и вызывать его в корпусе, представляющем собой список строк (каждая из которых является документом). Для CoherenceModel
требуется Dictionary
, но я не понимаю, что это соответствует и как я могу его получить. Я использую TfidfVectorizer
из sklearn
для векторизации текста и glove
встраивания из gensim
для вычисления сходства в моей модели.