В некоторых моделях встраивания использовалась модель Sentencepiece для токенизации. Таким образом, они дают векторы подслов для неизвестных слов, которых нет в словаре. Но я хочу получить вектор слов для каждого слова, такого как Word2ve c, fastText. Должен ли я усреднять векторы подслов для представления вектора слов?