guilt11 21 апреля 2019 23

Как мы определяем функцию формирования награды в обучении глубокому подкреплению, чтобы заставить двуногого робота ходить?

guilt11 / 21 апреля 2019

Я пытаюсь спроектировать функцию формирования награды для двуногого робота, я узнал о формировании награды «гуманоид» и «двуногий ходок» в тренажерном зале openai, однако робот ходит очень странным образом, не так, как ходьба человека.очень стабильныйКто-нибудь знает, как вручную разработать функцию формирования награды для двуногого робота, или есть какие-либо ресурсы для функции формирования награды двуногого робота?

...

Как мы определяем функцию формирования награды в обучении глубокому подкреплению, чтобы заставить двуногого робота ходить?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Как мы определяем функцию формирования награды в обучении глубокому подкреплению, чтобы заставить двуногого робота ходить?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы