шаг 1 : извлечение слов и их векторов для модели Spacy (см. Соответствующую документацию здесь ).
шаг 2 : создание экземпляракласса gensim.models.keyedvectors.WordEmbeddingsKeyedVectors (см. соответствующую документацию здесь ).
шаг 3 : добавьте добавление слов и векторов в экземпляр WordEmbeddingsKeyedVectors.
import spacy
from gensim.models.keyedvectors import WordEmbeddingsKeyedVectors
nlp = spacy.load('en_core_web_lg')
wordList =[]
vectorList = []
for key, vector in nlp.vocab.vectors.items():
wordList.append(nlp.vocab.strings[key] )
vectorList.append(vector)
kv = WordEmbeddingsKeyedVectors(nlp.vocab.vectors_length)
kv.add(wordList, vectorList)
print(kv.most_similar('software'))
# [('Software', 0.9999999403953552), ('SOFTWARE', 0.9999999403953552), ('Softwares', 0.738474428653717), ('softwares', 0.738474428653717), ('Freeware', 0.6730758547782898), ('freeware', 0.6730758547782898), ('computer', 0.67071533203125), ('Computer', 0.67071533203125), ('COMPUTER', 0.67071533203125), ('shareware', 0.6497008800506592)]