Я пытаюсь понять разницу между Doc2Vec и Deep Averaging Networks (DAN), как упомянуто в этом https://people.cs.umass.edu/~miyyer/pubs/2015_acl_dan.pdf
Я пытался различить обе модели, но они почти выглядят очень похожими на меня вгенерация подхода вложения.
Самое поразительное сходство, с которым я столкнулся, - это усреднение встраивания слов для Doc2Vec и DAN. Однако я понял, что мы можем добавить более глубокие слои для DAN. Разница настолько проста, или я упускаю что-то, что заметно важно?