Ошибка в обучении классификатора PyTorch от 60-минутного блица в GPU - PullRequest
0 голосов
/ 01 ноября 2018

Я начал изучать pytorch с их официального 60-минутного учебника по блицу в лаборатории jupyter (используя их файл .ipynb, ссылка на учебное пособие ) и успешно завершил его до преобразования и обучения классификатора с помощью графического процессора. Я думаю, что мне удалось изменить устройство для сети, входов и меток в соответствии с этими результатами:

net=net.to(device)
net.fc1.weight.type()

С выходом:

'torch.cuda.FloatTensor'

А:

inputs, labels = inputs.to(device), labels.to(device)
inputs.type(),labels.type()

С выходом:

('torch.cuda.FloatTensor', 'torch.cuda.LongTensor')

После запуска этих ячеек я запустил ячейку для обучения модели, содержащей этот код:

for epoch in range(2):  # loop over the dataset multiple times

running_loss = 0.0
for i, data in enumerate(trainloader, 0):
    # get the inputs
    inputs, labels = data

    # zero the parameter gradients
    optimizer.zero_grad()

    # forward + backward + optimize
    outputs = net(inputs)
    loss = criterion(outputs, labels)
    loss.backward()
    optimizer.step()

    # print statistics
    running_loss += loss.item()
    if i % 2000 == 1999:    # print every 2000 mini-batches
        print('[%d, %5d] loss: %.3f' %
              (epoch + 1, i + 1, running_loss / 2000))
        running_loss = 0.0

print('Finished Training') 

И получил эту ошибку:

RuntimeError                              Traceback (most recent call last)
<ipython-input-55-fe85c778b0e6> in <module>()
     10 
     11         # forward + backward + optimize
---> 12         outputs = net(inputs)
     13         loss = criterion(outputs, labels)
     14         loss.backward()

~\Anaconda3\lib\site-packages\torch\nn\modules\module.py in __call__(self, 
*input, **kwargs)
    475             result = self._slow_forward(*input, **kwargs)
    476         else:
--> 477             result = self.forward(*input, **kwargs)
    478         for hook in self._forward_hooks.values():
    479             hook_result = hook(self, input, result)

<ipython-input-52-725d44154459> in forward(self, x)
    14 
    15     def forward(self, x):
--->16         x=self.conv1(x)
    17         x = self.pool(F.relu(x))
    18         x = self.pool(F.relu(self.conv2(x)))

~\Anaconda3\lib\site-packages\torch\nn\modules\module.py in __call__(self, 
*input, **kwargs)
    475             result = self._slow_forward(*input, **kwargs)
    476         else:
--> 477             result = self.forward(*input, **kwargs)
    478         for hook in self._forward_hooks.values():
    479             hook_result = hook(self, input, result)

~\Anaconda3\lib\site-packages\torch\nn\modules\conv.py in forward(self, 
input)
    299     def forward(self, input):
    300         return F.conv2d(input, self.weight, self.bias, self.stride,
--> 301                         self.padding, self.dilation, self.groups)
    302 
    303 

RuntimeError: Expected object of type torch.FloatTensor but found type 
torch.cuda.FloatTensor for argument #2 'weight' 

Почему я получил эту ошибку и как ее исправить?

1 Ответ

0 голосов
/ 01 декабря 2018

Вам также необходимо переместить свои inputs и labels в графический процессор внутри цикла обучения.

for i, data in enumerate(trainloader, 0):
    # get the inputs
    inputs, labels = data

    # move to GPU
    inputs = inputs.to(device)
    labels = labels.to(device)

    ...
...