Я пытаюсь понять определенную ошибку, которую я получаю при запуске CartPole с использованием PyTorch double DQN
, в какой-то момент вывод действия выходит в виде тензора ([[- 0.0869, 0.1789]]) без ошибка; однако по какой-то причине в определенный момент тензор действия будет выглядеть как
тензор ([- 0,0931, 0,1897])
разница, которую я замечаю, состоит в том, что существует только один набор квадратов скобки по сравнению с двумя для примера, которые не вызывают ошибок.
Ошибка возникает, когда я пытаюсь использовать torch.argmax () на выходе действия тензора
тензор действия получается по-другому случайным образом вызывает кр sh
>>> import torch
>>> x = torch.tensor([0,1])
>>> print(x)
tensor([0, 1])
>>> print(torch.argmax(x,dim=1))
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
>>>