Ошибка выполнения при обучении модели в pytorch - PullRequest
0 голосов
/ 08 сентября 2018

RuntimeError: ошибка времени выполнения cuda (59):

epochs = 3
print_every = 40
steps = 0

# change to cuda
model.to(device)

for e in range(epochs):
    running_loss = 0
    for ii, (inputs, labels) in enumerate(trainloader):
        steps += 1
        inputs, labels = inputs.to(device), labels.to(device)

        optimizer.zero_grad()

        # Forward and backward passes
        outputs = model.forward(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        running_loss += loss.item()

        if steps % print_every == 0:
            print("Epoch: {}/{}... ".format(e+1, epochs),
                  "Loss: {:.4f}".format(running_loss/print_every))

            running_loss = 0

Я получаю приведенную ниже ошибку в приведенном выше коде.

RuntimeError: cuda runtime error (59) : device-side assert triggered at /opt/conda/conda-bld/pytorch_1524584710464/work/aten/src/THC/generic/THCTensorCopy.c:20

Я использую одну из предварительно обученных моделей из torchvision.models для получения функций изображения. Создайте и обучите новый классификатор прямой связи, используя эти функции.

и я не уверен, что я делаю здесь неправильно Кроме того, я запускаю этот код на онлайн-портале внутри jupyter norebook, где включен графический процессор.

Заранее спасибо за любую помощь !!

...