Question

Я работаю с примером линейной регрессии в PyTorch. Я знаю, что сделал неправильно, включая 'loss.backward ()' в 'с torch.no_grad ():', но почему это сработало с моим кодом?

Согласно документам Pytorch , torch.autograd.no_grad - это контекстный менеджер, который отключил вычисление градиента. Так что я действительно запутался.

Код здесь:

import torch
import torch.nn as nn
import numpy as np
import matplotlib.pyplot as plt
# Toy dataset
x_train = np.array([[3.3], [4.4], [5.5], [6.71], [6.93], [4.168], 
                    [9.779], [6.182], [7.59], [2.167], [7.042], 
                    [10.791], [5.313], [7.997], [3.1]], dtype=np.float32)

y_train = np.array([[1.7], [2.76], [2.09], [3.19], [1.694], [1.573], 
                    [3.366], [2.596], [2.53], [1.221], [2.827], 
                    [3.465], [1.65], [2.904], [1.3]], dtype=np.float32)

input_size = 1
output_size = 1
epochs = 100
learning_rate = 0.05

model = nn.Linear(input_size, output_size)


criterion = nn.MSELoss(reduction='sum')
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

# training
for epoch in range(epochs):
    # convert numpy to tensor
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)

    # forward
    out = model(inputs)
    loss = criterion(out, targets)

    # backward
    with torch.no_grad():
        model.zero_grad()
        loss.backward()
        optimizer.step()
        print('inputs grad : ', inputs.requires_grad)
    if epoch % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, epochs, loss.item()))

predicted = model(torch.from_numpy(x_train)).detach().numpy()
plt.plot(x_train, y_train, 'ro', label='Original data')
plt.plot(x_train, predicted, label='Fitted line')
plt.legend()
plt.show()

# Save the model checkpoint
torch.save(model.state_dict(), 'model\linear_model.ckpt')

Заранее спасибо за ответ на мой вопрос.

Xxxo · Answer 1 · 02 апреля 2020

Это сработало, потому что расчет потерь происходил до no_grad, и вы продолжаете вычислять градиенты в соответствии с этим расчетом потерь (в котором для расчета был включен градиент).

По сути, вы продолжаете обновлять вес ваших слоев, используя градиенты, рассчитанные за пределами no_grad.

Когда вы на самом деле используете no_grad:

for epoch in range(epochs):
    # convert numpy to tensor
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)
    with torch.no_grad():  # no_grad used here
    # forward
        out = model(inputs)
        loss = criterion(out, targets)
        model.zero_grad()
        loss.backward()
        optimizer.step()
        print('inputs grad : ', inputs.requires_grad)
    if epoch % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, epochs, loss.item()))

Тогда вы получите правильную ошибку, сказав:

element 0 of tensors does not require grad and does not have a grad_fn.

То есть вы используете no_grad там, где это не подходит.

Если вы напечатаете .requires_grad потери, то вы увидите, что потеря имеет requires_grad.

То есть, когда вы сделаете это:

for epoch in range(epochs):
    # convert numpy to tensor
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)

    # forward
    out = model(inputs)
    loss = criterion(out, targets)

    # backward
    with torch.no_grad():
        model.zero_grad()
        loss.backward()

        optimizer.step()
        print('inputs grad : ', inputs.requires_grad)
        print('loss grad : ', loss.requires_grad)  # Prints loss.require_rgad
    if epoch % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, epochs, loss.item()))

Вы увидите:

inputs grad :  False
loss grad :  True

Кроме того,

print('inputs grad : ', inputs.requires_grad)

Будет всегда печать False. То есть, если вы сделаете

for epoch in range(epochs):
    # convert numpy to tensor
    inputs = torch.from_numpy(x_train)
    targets = torch.from_numpy(y_train)

    print('inputs grad : ', inputs.requires_grad). # Print the inputs.requires_grad

    # forward
    out = model(inputs)
    loss = criterion(out, targets)

    # backward
    with torch.no_grad():
        model.zero_grad()
        loss.backward()

        optimizer.step()
        print('inputs grad : ', inputs.requires_grad)
        print('loss grad : ', loss.requires_grad)
    if epoch % 5 == 0:
        print ('Epoch [{}/{}], Loss: {:.4f}'.format(epoch+1, epochs, loss.item()))

, вы получите:

inputs grad :  False
inputs grad :  False
loss grad :  True

То есть вы используете неправильные вещи, чтобы проверить, что вы сделали неправильно. Лучшее, что вы можете сделать, это снова прочитать документы PyTorch по механике градиента.

Почему процесс обратного распространения все еще может работать, когда я включил функцию loss.backward () в метод torch.no_grad (): '?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Почему процесс обратного распространения все еще может работать, когда я включил функцию loss.backward () в метод torch.no_grad (): '?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы