В разделе о векторном сходстве отмечается, что маленькие модели содержат только контекстные векторы и другие модельные слова-векторы.Я пытался выяснить, как контекстные векторы обучаются / вычисляются (также в целом), но не повезло.
Что такое контекстные векторы и как их сходства сравниваются с подобиями между векторами слов?