Как скорость обучения влияет на градиентный спуск? - PullRequest
0 голосов
/ 18 сентября 2018

Когда градиентный спуск количественно указывает на то, что отклонения и веса значительно уменьшаются, что делает скорость обучения ?? Я новичок, кто-то, пожалуйста, просветите меня об этом.

1 Ответ

0 голосов
/ 18 сентября 2018

Скорость обучения - это гиперпараметр, который контролирует, насколько мы корректируем вес нашей сети с учетом градиента потерь.Чем ниже значение, тем медленнее мы движемся по нисходящему склону.Хотя это может быть хорошей идеей (с использованием низкой скорости обучения) с точки зрения обеспечения того, чтобы мы не пропустили ни одного локального минимума, это также может означать, что нам потребуется много времени для сближения, особенно если мы застряли наобласть плато.

новый_вес = существующий_вес - скорость обучения * градиент

Если скорость обучения слишком мала, градиентный спуск может быть медленным

Если скорость обучения быстрая, градиентный спуск может перескочитьминимум. Может не сойтись, может даже расходиться

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...