Проблема:
Я использую предварительно обученную перчатку модель с векторами для переобучения моей модели с конкретным доменом, скажем, #cars, после обучения я хочу найти похожие слова в своем домене, но у меня нет слов в корпусе моего домена, я думаю, что это от перчаток векторы.
model_2.most_similar(positive=['spacious'], topn=10)
[('bedrooms', 0.6275501251220703),
('roomy', 0.6149100065231323),
('luxurious', 0.6105825901031494),
('rooms', 0.5935696363449097),
('furnished', 0.5897485613822937),
('cramped', 0.5892841219902039),
('courtyard', 0.5721820592880249),
('bathrooms', 0.5618442893028259),
('opulent', 0.5592212677001953),
('expansive', 0.555268406867981)]
Здесь я ожидаю что-то вроде пространства для ног, просторных функций автомобиля, упомянутых в корпусе домена. Как мы можем исключить векторы перчаток, имея похожие векторы?
Спасибо