Регулировка весов для функции оценки - PullRequest
0 голосов
/ 21 марта 2011

Я кодировал некоторый AI для connect-4. Я хотел бы отрегулировать веса в определенных функциях оценки. У меня ограниченное время и оборудование, поэтому мой вопрос таков: очень ли плохо с точки зрения качества оценки выполнять «обучение» и корректировку весов на основе результатов, полученных при использовании поиска на более низкой глубине, чем те, которые будут использоваться при ИИ должен проявить себя наилучшим образом позже в ситуации, когда у него больше времени и, следовательно, он может искать дерево игры на более глубоких уровнях?

1 Ответ

1 голос
/ 13 декабря 2011

Ну, если у вас есть ограниченное время, вы должны отрегулировать веса с помощью поиска на более низкой глубине. Это очень похоже на идею обучения разнице во времени, которая используется для создания игр, подобных нардам. То есть вы можете использовать идею обучения с подкреплением. Разница во времени является разновидностью обучения подкреплению.

...