Позвольте мне определить обобщение как способность модели, которая завершила обучение, быть эффективной в прогнозировании по всему диапазону входных данных, включая входные данные, которые не являются частью обучения. С этой точки зрения, Word2Ve c не может предсказать слова, которые не являются частью обучающего набора данных, потому что он просто не обучился бы контексту его создания вложения. Чтобы квалифицироваться как метод обобщения, он должен иметь возможность прогнозировать входные данные, которые не были частью обучающего набора данных.
Word2Ve c модель поддерживает словарь слов для соответствующего встраивания / вектора. Таким образом, не может предсказать неизвестные слова. Это было одним из важных отличий между моделью fastText и Word2Ve c.