В паре действий состояния обучения, что такое «состояние»? - PullRequest
0 голосов
/ 17 апреля 2020

Привет всем, я пытаюсь написать глубокую обучающую сеть, я не использую какую-либо спортивную среду или что-то еще, просто cnn, использующий захват экрана. Так как я не использую тренажерные залы, красиво закодированные дружественные среды. что я на самом деле сохраняю для своего «состояния» - это просто изображение, которое сеть получает в качестве входных данных? У меня есть закодированные действия и награды, никаких проблем, кроме состояния, действия, награды, следующего состояния. Я не уверен, что именно я использую для «состояния» - это просто необработанные пиксельные данные или извилистое изображение? это будет работать? Любая помощь очень ценится. Надеюсь, я все понял, мне нужно сохранить состояние, действие, награду и следующее состояние в памяти воспроизведения, чтобы вернуть net, я просто не уверен, что это за состояние, если вы не используете открытый тренажерный зал .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...