Как научить правила игры для ай? - PullRequest
1 голос
/ 16 мая 2019

Я делаю AI как альфа GO, используя DQN.НО у меня проблемы с обучением правилам игры.ИИ не знает правила, согласно которому «нельзя класть камень в место, которое уже занято» в первый раз.Я пытался дать минус вознаграждение всякий раз, когда ИИ нарушает это правило.но не похоже, чтобы ИИ изучал правила.Я думаю, что правила обучения - это просто трата времени.Пожалуйста, поделитесь своей идеей со мной.

1 Ответ

0 голосов
/ 23 мая 2019

Что вы можете сделать, так это то, что когда вы находитесь в состоянии 's' и у вас есть, например, 8 возможных действий (таким образом, 8 выходов для вашей сети), но действия 1 2 3 не могут быть выполнены, вы можете минимизировать потери с помощьюцелевые значения Q вручную устанавливаются в 0 для всех действий инвалидов в состоянии 's'.

И для этапа обучения, когда действие, соответствующее наибольшему значению Q, является недействительным, просто выберите случайное действие и незабудьте установить целевое значение Q для этого действия на 0.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...