Мне нужно найти что-то похожее на model.most_similar()
. В то время как most_similar()
возвращает массив слов, наиболее похожих на тот, который указан в качестве входных данных, мне нужно найти своего рода "центр" спискаслов.
Есть ли какая-нибудь функция в gensim или каком-либо другом инструменте, который мог бы мне помочь?
Пример:
Учитывая {'chimichanga', 'taco', 'burrito'}
, центр может быть mexico
или food
, в зависимости от корпуса, на котором обучалась модель