Как использовать Asynchronous RL Framework (например, A3C) для обучения DDPG или TD3?
Я попробовал каждого актера-ученика в качестве агента DDPG и асинхронно обновлял глобального агента DDPG, но это не сработало.