Я смотрел видео на backprop с deeplearning.ai , где одна конкретная вещь меня сильно смутила. В backprop, как показано ниже,
backprop
Почему мы не усредняем dA[l-1] по m обучающим образцам?
dA[l-1]
m