Question

все.Я создаю простую спортивную среду под названием grid_world.Это мир сетки 4X4, в котором присутствуют агент и цель.цель - переместить агента к цели.Я использовал DQN для обучения моего агента, но обнаружил, что он недостаточно эффективен, даже не лучше, чем случайные действия.

Я отлаживал два дня, но все равно не смог найти никаких ошибок.Кто-нибудь может мне помочь?Заранее спасибо.

Мой код загружен на github: https://github.com/zhaoyu611/grid_world

как отладить пользовательскую среду в спортзале с помощью DQN

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

как отладить пользовательскую среду в спортзале с помощью DQN

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы