У меня есть двоичный файл word2vec, и я использую gensim
для его загрузки.
Хотя в gensim есть функция для получения similarity
между двумя словами, но нет функции для вычисления и возврата вектора разности.
Как я могу использовать два вектора и получить там разностный вектор?
А также я пытаюсь использовать эти разностные векторы как элемент классификации документов. Вычисление разностного вектора между каждым словом и каждым классом.Правильный ли это подход?
Например, если классы sport
и politics
sport = [0.4,0.456,45,...] #wordvector of class
politics = [0.23,0.56...] #wordvector of class
И мое слово football
football = [0.2,0.6,0.45,...] #wordvector of football
Я хочувычислить разностный вектор
(sport - football) = [some vector] # this as a feature for classification