Понимание обратных уравнений

0 голосов

mlRocks / 20 апреля 2019

Я смотрел видео на backprop с deeplearning.ai , где одна конкретная вещь меня сильно смутила. В backprop, как показано ниже,

Почему мы не усредняем dA[l-1] по m обучающим образцам?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.

Ошибка расчета в Backpropagation не работает правильно
Разбивка стохастического кода градиентного спуска в Python
Нейронная сеть в C для XOR, все выходы сходятся к одному значению
обратное распространение с более чем одним узлом на слой
Градиентный спуск без производной
Нужно ли включать мои масштабированные выходы в мое уравнение обратного распространения (SGD)?
Взвешивание нейронной сети
Почему `tf.train.Optimizer (). Compute_gradients (loss)` также возвращает переменные, которых нет в подграфе `loss`?
Как можно применить прямое распространение для моделей с однослойной прямой или многослойной прямой связью от Keras?
Как вы рассчитываете градиент смещения в конволюционной нейронной сети?

...