Модель Doc2Vec
может рассматривать только слова, которые она выучила во время обучения, из обучающих текстов. Неизвестные слова просто игнорируются.
Одно значение: документ с всеми новыми словами, переданными в infer_vector()
, вернет случайный результат. Все выводы начинаются с случайного вектора небольшой величины, который затем корректируется в процессе, похожем на обучение, чтобы лучше предсказать присутствующие слова. Но без известных слов модель вообще не может выполнять никаких постепенно улучшаемых прогнозов, поэтому логический вывод не выполняется после инициализации.