Я пробовал с этим кодом. Выход: Categorical(probs: torch.Size([12])))
. Я хочу извлечь значения из вывода и преобразовать его в массив numpy
. Кто-нибудь может дать предложение?
Я знаю, что могу вернуть значение (которое закомментировано). Но все же, есть ли решение?
class Actor(nn.Module):
def __init__(self, state_size, action_size):
super(Actor, self).__init__()
self.state_size = state_size
self.action_size = action_size
self.linear1 = nn.Linear(self.state_size, 128)
self.linear2 = nn.Linear(128, 256)
self.linear3 = nn.Linear(256, self.action_size)
def forward(self, state):
output = F.relu(self.linear1(state))
output = F.relu(self.linear2(output))
output = self.linear3(output)
distribution = Categorical(F.softmax(output, dim=-1))
# a=F.softmax(output, dim=-1)
# print(a.detach().numpy())
return distribution
output=Actor(state)
print(output)