Я получил нейронную сеть, которая предназначена для обратного распространения.
Я использовал следующее для обновления веса на скрытом слое
Δwji = η × δj × yi
где δj - это φ '(vj) * ej, где vj = Σi wjiyi, а для выходного слоя и φ' (vj) * сумма (δk * wkj) для предыдущих слоев
Однако один изуклон для скрытых юнитов всегда уходит в бесконечность.Что это значит?
РЕДАКТИРОВАТЬ:
Значения, идущие в бесконечность, оказываются входным значением vj некоторых нейронов.Итак, смысл этого в том, что мой NN только подтверждает тот факт, что определенный нейрон должен всегда срабатывать?
Может ли это означать, что у меня нет множества примеров для этих конкретных входных данных при обучении?