как отладить пользовательскую среду в спортзале с помощью DQN - PullRequest
0 голосов
/ 23 октября 2018

все.Я создаю простую спортивную среду под названием grid_world.Это мир сетки 4X4, в котором присутствуют агент и цель.цель - переместить агента к цели.Я использовал DQN для обучения моего агента, но обнаружил, что он недостаточно эффективен, даже не лучше, чем случайные действия.

Я отлаживал два дня, но все равно не смог найти никаких ошибок.Кто-нибудь может мне помочь?Заранее спасибо.

Мой код загружен на github: https://github.com/zhaoyu611/grid_world

...