Основное различие между порождающими и дискриминационными моделями заключается в том, что порождающие модели описывают совместное распределение его входов и выходов, тогда как дискриминативные описывают условное распределение выходов при заданных входах.
Таким образом, Word2Vec обучается дискриминационно : в CBOW мы предсказываем слово с учетом его контекста, модель скип-граммы работает наоборот.
Когда вы говорите, чтоон генерирует вложение, это другой смысл «генерировать», это не означает выборку из совместного распределения, а скорее генерацию в целом.
Мое мнение таково, что как только вложения обучаются, он не создаетимеет смысл говорить об этом как о дискриминационной (не порождающей) модели, потому что вы используете только представление, а не распределение вероятностей, которое определяет модель.