Как быстро ожидается, что нейронная сеть приблизится к функции z = y ^ 2 + x ^ 2?
Похоже, у меня возникают проблемы, когда я делаю входные данные отрицательными, и все веса становятся очень маленькими (* 10 ^ -16! Если использовать 2x40x1) или становятся одинаковыми (например, -0,16 и 0,16, если используются 2x20x1). Я использую 2000 примеров ввода за эпоху.
Однако, похоже, все в порядке, если все входы положительные. Что бы это могло значить?
Как вы думаете, какое количество входных пар на эпоху, архитектуру и количество эпох я должен использовать для решения этой проблемы?
Я использую backprop, нейронную сеть без смещения с 1 скрытым слоем (и все мои входы находятся между -1 и +1 и желаемыми выходами [0, 1]).
Спасибо,