Я занимаюсь исследованиями и мне любопытно, как влияет градиентный спуск на слои по отдельности.Как мы все знаем, градиентный спуск всегда пытается вывести нас к глобальному минимуму долины.Однако мне интересно, можем ли мы считать какой-либо один слой наиболее ответственным за то, чтобы добраться до самого глубокого местоположения.В противном случае возможно ли, чтобы более ранние или более поздние слои были более или менее терпимы к неправильным обновлениям веса?Комментарии приветствуются, однако любая статья, посвященная этой проблеме, будет отличной.