Question

Я тренировал Word2Ve c Модель и пытаюсь сформулировать математическую функцию наиболее сходных функций. Я думал о наборе, которое содержит n наиболее похожих слов, данное слово в качестве ссылки.

Существует ли где-нибудь хорошее определение?

gojomo · Answer 1 · 19 января 2020

Вы можете просмотреть исходный код, который реализует most_similar() для абстракции KeyedVectors библиотеки gensim Python библиотеки (для хранения и выполнения общих действий над наборами векторов слов):

https://github.com/RaRe-Technologies/gensim/blob/fbc7d0952f1461fb5de3f6423318ae33d87524e3/gensim/models/keyedvectors.py#L491

Грубо говоря, сначала вычисляется целевой вектор - путем объединения любых positive & negative примеров, предоставленных вызывающей стороной. В общем случае это может быть только один («положительный») вектор-слово.

Затем он вычисляет косинусное сходство с любым другим вектором, сортирует эти сходства по наибольшему и возвращает результаты с наибольшим N.

Word2Ve c Wordvectors Самые похожие

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Word2Ve c Wordvectors Самые похожие

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы