Когда вы получаете сообщение об ошибке, что слово отсутствует в словаре, это означает, что слово отсутствует в этой модели.
Любая попытка найти его приведет к выдаче KeyError
, чтобы вы знали, Вы пытаетесь получить слово-вектор, которого там нет.
Вам следует отфильтровать списки токенов, прежде чем передавать их на n_similarity()
, чтобы они включали только допустимые слова.
Конечно, это означает, что вы не можете получить значимый результат по слову 'selfie'
. Это бессмысленная ерунда для модели, как будто вы спросили слово 'asruhfglaiwurfliuawiufsdfsdfs'
.