В чем разница между проблемой деградации и проблемой исчезающего градиента в статье ResNet? - PullRequest
0 голосов
/ 20 октября 2019

Я так растерялся из-за проблемы деградации, что немного знаю о проблемах исчезновения и взрыва градиента, но почему точность обучения снижается в глубокой сети при использовании пакетной нормы и ReLU для решения проблемы исчезновения градиента!

...