Алгоритм Сильвы и Алмейды улучшает существующий алгоритм обратного распространения путем введения индивидуальных адаптивных скоростей обучения для каждого веса.Значение для новой скорости обучения вычисляется следующим образом:
Я прочитал, что константы u
и d
установлены на u > 1
и d < 1
,Эти ограничения довольно широкие, поэтому есть ли какие-то общие рекомендации по установке этих значений, или мне нужно выяснить это экспериментально для моей конкретной проблемы?