Что означает мульти-бинарные действия в Gym Retro Airstriker-Genesis? - PullRequest
0 голосов
/ 16 февраля 2020

Я только начал DQN с Cartpole и MountainCar, он работал для отдельных действий, но теперь я хочу работать над немного более сложными играми, я тестировал ретро-среду, чтобы увидеть, как она работает. Теперь я не могу понять, что такое мультибинарное действие, я запустил этот код, чтобы напечатать, какие действия предприняты, но я не знаю, что это значит.

import retro
env = retro.make(game='Airstriker-Genesis')
obs = env.reset()
while True:
     print(env.action_space.sample())
     obs, rew, done, info = env.step(env.action_space.sample())
     if done:
          break

выходы:

....
[1 1 1 0 0 1 1 1 0 0 0 0]
[0 0 0 1 1 0 1 1 1 0 0 1]
[0 1 1 0 0 0 1 0 0 1 0 1]
[1 1 1 1 0 0 0 1 1 1 0 0]
[1 1 0 0 1 1 0 1 0 0 1 1]
[0 1 0 1 0 1 0 0 0 1 0 1]
[0 1 0 1 0 0 1 1 0 1 0 1]
[0 1 1 1 1 0 1 1 0 1 0 1]
[1 1 1 1 1 0 0 1 1 0 1 1]
[1 1 0 0 1 1 1 0 0 1 0 0]
....

Может кто-нибудь объяснить, как эти выходы описывают, какое действие предпринять? Спасибо за вашу помощь.

...