Question

Как получить наиболее часто встречающиеся контекстные слова из предварительно подготовленной модели быстрого текста?

Например: для слова «футбол» и корпус ["I like playing football with my friends"]

Получить список контекстных слов: ['playing', 'with','my','like']

Я пытаюсь использовать model_wiki = gensim.models.KeyedVectors.load_word2vec_format("wiki.ru.vec") model.most_similar("блок")

Но меня это не устраивает

gojomo · Answer 1 · 29 декабря 2018

Обычная модель не сохраняет такую статистику совпадений из исходного корпуса.Это просто имеет обученные результаты: векторов на слово.

Итак, ранжированный список most_similar() векторов - который не совсем слова, которые появились вместе, но строго соотносятся с этим - является лучшим, что вы получите из этого файла.

Только возврат к исходному учебному корпусу даст вам именно то, что вы просили.

Как получить список контекстных слов в Gensim

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как получить список контекстных слов в Gensim

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы