Шипы в бревнах Tensorboard - стабильные базовые показатели PPO2 - PullRequest
0 голосов
/ 18 января 2020

Python3 .7 - Tensorflow 1.14.0

Я использую пользовательскую среду спортзала, используя стабильную базовую модель PPO2 , с MlpLstmPolicy в качестве политики.

После обучения модели я посмотрел логи Tensorboard. На вкладках «Вход» и «Потери» четко видны пики по всем графикам

Tesorboard logs - Scalars tab - Input

Tesorboard logs - Scalars tab - Loss

Это крупный план Loss chart

Кто-нибудь знает, почему это происходит, из-за наборов данных, из-за гиперпараметров или из-за окружающей среды? ?

Я знаю, что это очень широкий вопрос, надеюсь, кто-то может помочь ...

Дайте мне знать, если я могу помочь, предоставив более подробную информацию c info

...