Я всегда использую один скрытый слой.Теоретически, нет функций, которые могут быть аппроксимированы двумя или более скрытыми слоями, которые не могут быть аппроксимированы одним.Чтобы сделать один скрытый слой более сложным, добавьте больше скрытых узлов.
Как правило, количество скрытых узлов варьируется, чтобы наблюдать влияние на производительность модели (измеряемое точностью или чем-то еще).Слишком малое количество скрытых узлов приводит к худшему соответствию из-за недостаточного соответствия (функция вывода нейронной сети слишком проста и пропускает важные детали в данных).Слишком много скрытых узлов приводит к худшему соответствию из-за переоснащения (нейронная сеть становится настолько гибкой, что преследует каждый бит шума в данных).