Я запутался в использовании строки tf.reduce_mean(tf.nn.l2_loss(prediction - output))
.
При обратном распространении выходной сигнал должен быть вектором, так как прогнозируемый выходной сигнал каждого выходного нейрона вычитается из фактического выходного значения, и это повторяется для всех выходных нейронов, поэтому мы получаем вектор размером (n,1)
. Если мы используем tf.reduce_mean(tf.nn.l2_loss(prediction - output))
, на выходе будет одно значение. Я не могу понять, как это единственное значение будет распространяться для обновления весов. Разве это не должно быть всегда вектором?