После вычисления потери, которая явно появляется на cuda, когда я ее распечатываю, я не могу получить сумму градиентов, и вместо этого возвращается вышеуказанная ошибка.
LOSS tensor([166.3609], device='cuda:0', grad_fn=<SubBackward0>)