Question

У меня есть несколько вопросов об обучении нейронной сети с использованием обучения с подкреплением, например, DQN: 1. Должны ли мы использовать регуляризаторы или выбывшие при определении нашей модели?2. Что мы можем контролировать на этапе обучения?

user2104994 · Answer 1 · 06 февраля 2019

Не существует универсального ответа на этот вопрос.Это действительно зависит от вашей среды и вашего подхода, и лучше всего было бы провести тестирование с результатами и без них и сравнить результаты.
Вы всегда можете начать с наблюдения за потерями в сети и некоторым показателем производительности среды для каждого эпизода (если в вашей среде есть какая-то игра, вы можете отслеживать свой результат за эпизод)

Настройка нейронной сети и мониторинг в обучении армированию

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Настройка нейронной сети и мониторинг в обучении армированию

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы