S.EB 05 декабря 2018 88

Почему значение потерь решателя Адама возрастает после 100 000 итераций?

S.EB / 05 декабря 2018

Я уже тренировал CNN с SGD, и он тренируется хорошо.Однако, как только я тренирую модель с помощью решателя Адама, после почти 1001 * итерации она начинает увеличивать величину потерь.Не могли бы вы помочь мне интерпретировать это?

Ниже показано solver.prototxt:

momentum: 0.99
momentum2: 0.999  #+
test_interval: 1000
test_iter: 40
weight_decay: 0.0005
base_lr:       0.0001

...

Почему значение потерь решателя Адама возрастает после 100 000 итераций?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Почему значение потерь решателя Адама возрастает после 100 000 итераций?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы