Как добавить слова и векторы вручную в Word2vec Gensim? - PullRequest
0 голосов
/ 05 ноября 2019

Допустим, word2vec.model - моя обученная модель word2vec. Когда встречается слово вне словаря ( oov_word ), я вычисляю вектор vec , используя метод compute_vec (oov_word) . Теперь я хочу добавить / добавить oov_word и соответствующий ему вектор vec к моей уже обученной модели word2vec.model .

У меня уже естьпроверил ссылки ниже. Но они не отвечают на мой вопрос.

Объединение / добавление векторов из разных моделей word2vec

https://datascience.stackexchange.com/questions/49431/how-to-train-an-existing-word2vec-gensim-model-on-new-words

https://radimrehurek.com/gensim/models/keyedvectors.html#gensim.models.keyedvectors.BaseKeyedVectors.add

1 Ответ

0 голосов
/ 06 ноября 2019
from gensim.models.keyedvectors import WordEmbeddingsKeyedVectors
vector_length = 100
kv = WordEmbeddingsKeyedVectors(vector_length)

# wordList - list of words
# vectorList - list of the vector corresponding to the words

kv.add(wordList, vectorList)

kv.most_similar(word1) # gives the list of words similar to word1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...