Я не уверен, в чем ваш вопрос, но я сам прошел этот урок и могу заверить вас, кроме одной очевидной опечатки, в этом нет ничего неправильного.
Я сделаю предположение, что ваш вопрос связан с тем, что вы не понимаете, как получается обратное распространение скрытое дельта. Если это действительно ваш вопрос, пожалуйста, рассмотрите
(источник: pandamatak.com )
Вы, вероятно, не понимаете, как автор вывел это уравнение. На самом деле это прямое применение правила многомерной цепочки. А именно, (то, что следует из wikipedia )
"Предположим, что каждый аргумент z = f (u, v) является функцией с двумя переменными, такой что u = h (x, y) и v = g (x, y), и что все эти функции дифференцируемы Тогда правило цепочки будет выглядеть так:
«
Теперь представьте, что расширение цепного правила с помощью аргумента индукции до
Е (г '* +1031 * 1 * 1 032 *, г' 2 , .., г ' N )
где z ' k - выход предварительной активации k-го слоя,
и z ' k (w ji ), то есть E является функцией от z', а сам z 'является функцией от w ji ( если это поначалу не имеет смысла , то очень тщательно подумайте о том, как настраивается NN.) Применение правила цепочки, непосредственно расширенного до n переменных:
* +1049 * & Delta; Е (г ' 1 * 1 051 *, г' * +1052 * 2 , .., г ' N ) * +1056 * / & delta; w ji = & Sigma; k & delta; E / & delta; z ' k & delta; z ' k / & delta; w ji
, что является наиболее важным шагом, автор затем снова применяет правило цепочки, на этот раз в пределах суммы, чтобы расширить & delta; z ' k / & delta; w ji срок, то есть
& delta; z ' k / & delta; w ji = & delta; z' k * 1 099 * / * * & 1 101 дельты; о J
& Delta; O J / & Delta; г J
* +1113 * & Delta; г J / & Delta;. Ш джи * * +1121
Если у вас возникли трудности с пониманием правила цепочки, вам может потребоваться пройти курс по многомерному исчислению или прочитать такой раздел в учебнике.
Удачи.