Я только начал DQN с Cartpole и MountainCar, он работал для отдельных действий, но теперь я хочу работать над немного более сложными играми, я тестировал ретро-среду, чтобы увидеть, как она работает. Теперь я не могу понять, что такое мультибинарное действие, я запустил этот код, чтобы напечатать, какие действия предприняты, но я не знаю, что это значит.
import retro
env = retro.make(game='Airstriker-Genesis')
obs = env.reset()
while True:
print(env.action_space.sample())
obs, rew, done, info = env.step(env.action_space.sample())
if done:
break
выходы:
....
[1 1 1 0 0 1 1 1 0 0 0 0]
[0 0 0 1 1 0 1 1 1 0 0 1]
[0 1 1 0 0 0 1 0 0 1 0 1]
[1 1 1 1 0 0 0 1 1 1 0 0]
[1 1 0 0 1 1 0 1 0 0 1 1]
[0 1 0 1 0 1 0 0 0 1 0 1]
[0 1 0 1 0 0 1 1 0 1 0 1]
[0 1 1 1 1 0 1 1 0 1 0 1]
[1 1 1 1 1 0 0 1 1 0 1 1]
[1 1 0 0 1 1 1 0 0 1 0 0]
....
Может кто-нибудь объяснить, как эти выходы описывают, какое действие предпринять? Спасибо за вашу помощь.