Настройка нейронной сети и мониторинг в обучении армированию - PullRequest
0 голосов
/ 06 февраля 2019

У меня есть несколько вопросов об обучении нейронной сети с использованием обучения с подкреплением, например, DQN: 1. Должны ли мы использовать регуляризаторы или выбывшие при определении нашей модели?2. Что мы можем контролировать на этапе обучения?

1 Ответ

0 голосов
/ 06 февраля 2019
  1. Не существует универсального ответа на этот вопрос.Это действительно зависит от вашей среды и вашего подхода, и лучше всего было бы провести тестирование с результатами и без них и сравнить результаты.
  2. Вы всегда можете начать с наблюдения за потерями в сети и некоторым показателем производительности среды для каждого эпизода (если в вашей среде есть какая-то игра, вы можете отслеживать свой результат за эпизод)
...