Я пытаюсь настроить DQNAgent или DDPGAgent в keras-rl с пользовательской средой. Мне нужна модель, чтобы дать вывод (действие) 48 чисел (в основном массив). Я попытался определить выходные данные как объект spaces.box следующим образом:
self.action_space = spaces.Box(low=self.boundsLow, high=self.boundsHigh, shape=(48, ), dtype=np.int32)
Я также попытался использовать пространство действия Multidiscrete.
Ошибка в том, что в функции step () я только получить значение I (число) из нейронной сети: `` `def step (self, action): print (action)
The neural network:
```
model.add(Flatten(input_shape=(1,) + env.observation_space.shape))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(48))
model.add(Activation('linear'))
print(model.summary())
Как возможно, что я получаю только одно число в качестве действия? Может ли кто-нибудь помочь?
Спасибо!