Усиление обучения keras - действие с несколькими выходами - PullRequest
0 голосов
/ 22 апреля 2020

Я пытаюсь настроить DQNAgent или DDPGAgent в keras-rl с пользовательской средой. Мне нужна модель, чтобы дать вывод (действие) 48 чисел (в основном массив). Я попытался определить выходные данные как объект spaces.box следующим образом:

self.action_space = spaces.Box(low=self.boundsLow, high=self.boundsHigh, shape=(48, ), dtype=np.int32)

Я также попытался использовать пространство действия Multidiscrete.

Ошибка в том, что в функции step () я только получить значение I (число) из нейронной сети: `` `def step (self, action): print (action)


The neural network:
    ```
model.add(Flatten(input_shape=(1,) + env.observation_space.shape))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(300))
model.add(Activation('relu'))
model.add(Dense(48))
model.add(Activation('linear'))
print(model.summary())

Как возможно, что я получаю только одно число в качестве действия? Может ли кто-нибудь помочь?

Спасибо!

...