Дополняя ответ blahdiblah , глядя на исходный код, я думаю, что параметр weights
соответствует скорости обучения обратное распространение (читая руководство, я не смог ' не понимаю, что это было). Посмотрите файл nnet.c , строка 236 , внутренняя функция fpass :
TotalError += wx * E(Outputs[i], goal[i - FirstOutput]);
здесь, в очень интуитивно понятной номенклатуре, E
соответствует ошибке bp , а wx
- это параметр, передаваемый функции, которая в конечном итоге соответствует идентификатору Weights[i]
.
Также вы можете быть уверены, что параметр decay
действительно является тем, что он утверждает, перейдя к строкам 317 ~ 319 того же файла, внутри функции VR_dfunc :
for (i = 0; i < Nweights; i++)
sum1 += Decay[i] * p[i] * p[i];
*fp = TotalError + sum1;
, где p
соответствует весам соединений, что является точным определением регуляризации weight-decay .