Вы задали отличный вопрос, и ответ - нет.
Поскольку Aldream уже указал несколько работ, в которых используется асимметричная архитектура, я хотел бы указать на теоретическую работу, связанную с вашим вопросом.
Я полагаю, что лучшее объяснение можно найти в документе конференции ICLR 2017: «Вариационный автокодер с потерями», Си Чен и др.
Раздел 2 является обязательным для чтения разделом. Автор связывает вариационный автоэнкодер с кодированием с обратной связью и показывает, что средняя длина кода (которая эквивалентна вариационной нижней границе) всегда имеет дополнительную длину кода при использовании приближенного апостериорного распределения. Когда декодер VAE (который имеет логарифмическое сходство p (x | z)) может моделировать данные без необходимости q (z | x), VAE игнорирует скрытую переменную!
Это означает, что если у нас очень сильный декодер (например, такое же количество слоев, как у кодера), то существует риск того, что VAE может полностью игнорировать обучение q (z | x), просто установив q (z | x) ) к предыдущему p (z), следовательно, сохраняет потери KL до 0.
Для получения более подробной информации, пожалуйста, прочитайте статью выше. На мой взгляд, подключение VAE к кодированию с обратной связью элегантно.