Как мы определяем функцию формирования награды в обучении глубокому подкреплению, чтобы заставить двуногого робота ходить? - PullRequest
0 голосов
/ 21 апреля 2019

Я пытаюсь спроектировать функцию формирования награды для двуногого робота, я узнал о формировании награды «гуманоид» и «двуногий ходок» в тренажерном зале openai, однако робот ходит очень странным образом, не так, как ходьба человека.очень стабильныйКто-нибудь знает, как вручную разработать функцию формирования награды для двуногого робота, или есть какие-либо ресурсы для функции формирования награды двуногого робота?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...