Не знаете, как приступить к созданию состояния наблюдения из данных, которые у меня есть для Deep Q Learning in Gym - PullRequest
0 голосов
/ 18 февраля 2020

Я создаю спортивную среду, сражаясь с покемонами, и у меня есть все данные, необходимые для создания довольно хорошего состояния наблюдения. Pokemon Hps, статистика, имена (как номера идентификаторов pokedex), доступные ходы ... et c В настоящее время они хранятся в виде отдельных numpy массивов различного размера. Я не уверен, как я мог бы преобразовать все эти данные в объект gym.spaces (или какой объект пространства), а также как это будет относиться к тензору, который я могу использовать для своих 2 нейронных сетей, чтобы найти цель и ожидаемый q ценности.

Любая помощь будет принята с благодарностью.

...