все.Я создаю простую спортивную среду под названием grid_world.Это мир сетки 4X4, в котором присутствуют агент и цель.цель - переместить агента к цели.Я использовал DQN для обучения моего агента, но обнаружил, что он недостаточно эффективен, даже не лучше, чем случайные действия.
Я отлаживал два дня, но все равно не смог найти никаких ошибок.Кто-нибудь может мне помочь?Заранее спасибо.
Мой код загружен на github: https://github.com/zhaoyu611/grid_world