Question

С какими состояниями я мог бы работать на моем обычном домашнем компьютере, когда я хочу реализовать алгоритм обучения с подкреплением, такой как Q-Learning? 1 тысяча, миллион, больше?

neel g · Answer 1 · 15 апреля 2020

Крайне нежелательно управлять многими штатами. Причина действительно проста - когда в памяти много состояний, к тому времени, когда графический процессор находит это состояние и соответствующее ему действие, игра уже переходит в другое состояние.

Таким образом, решение заключается в использовании нечто более продвинутое, чем наивное Q-обучение. Смотрите Deep Q-learning и другие популярные варианты RL, такие как A3 C. Они помогают избежать этой проблемы

С какими состояниями я мог бы работать на моем обычном домашнем компьютере при использовании Q-learning?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

С какими состояниями я мог бы работать на моем обычном домашнем компьютере при использовании Q-learning?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы