Я исследовал множество роботизированных сред, разработанных в тренажерном зале OpenAI. https://gym.openai.com/envs/#robotics. Тем не менее, я мог бы заметить, что все роботизированные руки, которые используются в настоящее время для задач обучения усилению, могут двигаться только по одной оси (или направлению). Что если есть универсальный сустав или сустав, который может вращать кость по всем 3 осям (x, y, z)? Может ли ванильный DDPG (Глубокий детерминированный политический градиент) решить эти типы проблем?
Универсальный шарнир
(https://www.surpluscenter.com/productImages/image.axd/i.1-2730/w.1000/h.1000/1++Keyed+12+HP+Universal+Joint_L.jpg)
(Примечание: для каждого сустава будет 3 возможных оси вращения. Следовательно, пространство действия будет очень большим. Более того, вращение вдоль любой оси влияет на 2 координаты кости. Следовательно, состояния для DDPG Алгоритмы должны включать все 3 координаты каждой кости.)