Я понял, что обучение сети - это поиск правильных весов с Алгоритмами оптимизации , решающими, как веса обновляется до тех пор, пока один , необходимый для получения правильного прогноза, не появится.
Таким образом, основной капитал составляет $ $ 1016 * на основной миллион:
(1.) Если optimization algorithms
обновляет веса , что loss functions
делает для веса сети?
(2.) Являются ли loss functions
только для выходного уровня нейронной сети?(большинство примеров, которые я вижу с помощью deeplearning4j
, реализуют его на выходном уровне).
PS: Я действительноЯ хочу понять основную разницу между этими двумя понятиями самым простым способом.Я не ищу ничего сложного или каких-то математических взрывов.