Re snet исчезающий градиент - PullRequest
0 голосов
/ 17 апреля 2020

В очень глубоких нейронных сетях веса в более ранних слоях иногда не обновляются. Таким образом, по сравнению с неглубокими сетями, эти сети имеют более высокие потери. Почему веса в более ранних слоях не обновляются?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...