Я бы хотел построить автономный корабль в виртуальной среде с использованием DDPG .
Однако проблема в том, что есть пространство действия (-180 ', +180') для рулевого управления, и DDPG сможет выбрать -180 'в (t-1) и +180' в (t +) 1), что невозможно в реальном мире. (в принципе, вы не можете так быстро вращать руль.)
Возможное решение, о котором я думал, было следующим:
- Установить максимальную скорость рулевого управления (например, 10 'на шаг)
- Если выполненное действие выходит за пределы доступного диапазона действий (current_steeringWheel_angle - 10 ', current_steeringWheel_angle + 10'), измените выполненное действие на конечное значение в доступном диапазоне действий
- Сделайте шаг с измененным действием в виртуальной среде.
(1-й вариант) обновить DDPG с измененным действием.
(2-й вариант) обновить DDPG первоначально выполненным действием.