Как получить список контекстных слов в Gensim - PullRequest
0 голосов
/ 28 декабря 2018

Как получить наиболее часто встречающиеся контекстные слова из предварительно подготовленной модели быстрого текста?

Например: для слова «футбол» и корпус ["I like playing football with my friends"]

Получить список контекстных слов: ['playing', 'with','my','like']

Я пытаюсь использовать model_wiki = gensim.models.KeyedVectors.load_word2vec_format("wiki.ru.vec") model.most_similar("блок")

Но меня это не устраивает

1 Ответ

0 голосов
/ 29 декабря 2018

Обычная модель не сохраняет такую ​​статистику совпадений из исходного корпуса.Это просто имеет обученные результаты: векторов на слово.

Итак, ранжированный список most_similar() векторов - который не совсем слова, которые появились вместе, но строго соотносятся с этим - является лучшим, что вы получите из этого файла.

Только возврат к исходному учебному корпусу даст вам именно то, что вы просили.

...