Question

Я кодировал некоторый AI для connect-4. Я хотел бы отрегулировать веса в определенных функциях оценки. У меня ограниченное время и оборудование, поэтому мой вопрос таков: очень ли плохо с точки зрения качества оценки выполнять «обучение» и корректировку весов на основе результатов, полученных при использовании поиска на более низкой глубине, чем те, которые будут использоваться при ИИ должен проявить себя наилучшим образом позже в ситуации, когда у него больше времени и, следовательно, он может искать дерево игры на более глубоких уровнях?

Programmer · Answer 1 · 13 декабря 2011

Ну, если у вас есть ограниченное время, вы должны отрегулировать веса с помощью поиска на более низкой глубине. Это очень похоже на идею обучения разнице во времени, которая используется для создания игр, подобных нардам. То есть вы можете использовать идею обучения с подкреплением. Разница во времени является разновидностью обучения подкреплению.

Регулировка весов для функции оценки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Регулировка весов для функции оценки

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы