Я новичок в машинном обучении и пробую один код, написанный на pong-v0.Я использую метод градиента...
Я хочу создать агент градиента политики, который сможет играть в Doom с помощью этого руководства