Алгоритм градиентного спуска и различные скорости обучения - PullRequest
0 голосов
/ 23 апреля 2020

В алгоритме градиентного спуска мы можем выбрать скорость обучения, которая будет отличаться на каждой итерации алгоритма до его сходимости?

1 Ответ

0 голосов
/ 23 апреля 2020

Да, существует множество способов установить гиперпараметры в соответствии с функциями эпохи / итерации или производных потерь. Изменение скорости обучения при градиентном спуске интуитивно означает изменение размера шага, при этом один компромисс - большие шаги, выходящие за локальные оптимумы, но потенциально требующие большего количества шагов для схождения. Обычно начинать с большого и уменьшать имеет смысл, но есть много более оптимизированных методов, ускоряющих / регулирующих поведение подгонки и скалярной скорости обучения

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...