С какими состояниями я мог бы работать на моем обычном домашнем компьютере при использовании Q-learning? - PullRequest
0 голосов
/ 15 апреля 2020

С какими состояниями я мог бы работать на моем обычном домашнем компьютере, когда я хочу реализовать алгоритм обучения с подкреплением, такой как Q-Learning? 1 тысяча, миллион, больше?

1 Ответ

1 голос
/ 15 апреля 2020

Крайне нежелательно управлять многими штатами. Причина действительно проста - когда в памяти много состояний, к тому времени, когда графический процессор находит это состояние и соответствующее ему действие, игра уже переходит в другое состояние.

Таким образом, решение заключается в использовании нечто более продвинутое, чем наивное Q-обучение. Смотрите Deep Q-learning и другие популярные варианты RL, такие как A3 C. Они помогают избежать этой проблемы

...