В настоящее время я работаю над изучением глубокого подкрепления и пытаюсь реализовать наземную проблему, используя глубокие детерминированные градиенты политики, используя pytorch.