Разве актер-критик c не может решить проблему горных автомобилей?

Кто-нибудь пытался решить горную автомобильную среду методом актера-критики c (RL)? Эта среда может быть легко решена с помощью алгоритма DQN или DDQN. Однако, похоже, что он не работает методом actor-criti c. Следующая ссылка - мой код: https://github.com/alanyuw… / Moutain-Car-Environment /… / master

Кроме того, я также использовал код из Hu go Germain и столкнулся с тем же проблема. Ссылка следующая: https://github.com/germain-hug/Deep-RL-Keras

Разве актер-критик c не может решить проблему горных автомобилей?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Разве актер-критик c не может решить проблему горных автомобилей?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы