Question

Я делаю AI как альфа GO, используя DQN.НО у меня проблемы с обучением правилам игры.ИИ не знает правила, согласно которому «нельзя класть камень в место, которое уже занято» в первый раз.Я пытался дать минус вознаграждение всякий раз, когда ИИ нарушает это правило.но не похоже, чтобы ИИ изучал правила.Я думаю, что правила обучения - это просто трата времени.Пожалуйста, поделитесь своей идеей со мной.

Xeyes · Answer 1 · 23 мая 2019

Что вы можете сделать, так это то, что когда вы находитесь в состоянии 's' и у вас есть, например, 8 возможных действий (таким образом, 8 выходов для вашей сети), но действия 1 2 3 не могут быть выполнены, вы можете минимизировать потери с помощьюцелевые значения Q вручную устанавливаются в 0 для всех действий инвалидов в состоянии 's'.

И для этапа обучения, когда действие, соответствующее наибольшему значению Q, является недействительным, просто выберите случайное действие и незабудьте установить целевое значение Q для этого действия на 0.

Как научить правила игры для ай?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как научить правила игры для ай?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы