Кто-нибудь пытался решить горную автомобильную среду методом актера-критики c (RL)? Эта среда может быть легко решена с помощью алгоритма DQN или DDQN. Однако, похоже, что он не работает методом actor-criti c. Следующая ссылка - мой код: https://github.com/alanyuw… / Moutain-Car-Environment /… / master
Кроме того, я также использовал код из Hu go Germain и столкнулся с тем же проблема. Ссылка следующая: https://github.com/germain-hug/Deep-RL-Keras