Пример CartPole Действие тензора происходит случайным образом - PullRequest
0 голосов
/ 13 февраля 2020

Я пытаюсь понять определенную ошибку, которую я получаю при запуске CartPole с использованием PyTorch double DQN

, в какой-то момент вывод действия выходит в виде тензора ([[- 0.0869, 0.1789]]) без ошибка; однако по какой-то причине в определенный момент тензор действия будет выглядеть как

тензор ([- 0,0931, 0,1897])

разница, которую я замечаю, состоит в том, что существует только один набор квадратов скобки по сравнению с двумя для примера, которые не вызывают ошибок.

Ошибка возникает, когда я пытаюсь использовать torch.argmax () на выходе действия тензора

тензор действия получается по-другому случайным образом вызывает кр sh

>>> import torch
>>> x = torch.tensor([0,1])
>>> print(x)
tensor([0, 1])
>>> print(torch.argmax(x,dim=1))
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
IndexError: Dimension out of range (expected to be in range of [-1, 0], but got 1)
>>>
...