Question

Я назначил разные weight_decay для параметров, а training loss и testing loss были все нан.

Я напечатал prediction_train,loss_train,running_loss_train,prediction_test,loss_test,and running_loss_test, все они были нан.

И я проверил данные с numpy.any(numpy.isnan(dataset)), он вернул False.

Если я использую optimizer = torch.optim.Adam(wnn.parameters()) вместо назначения других weight_decay для параметров, проблем не будет.

Не могли бы вы сказать мне, как это исправить? Вот коды, я сам определил функцию активации. Спасибо:)

class Morlet(nn.Module):
def __init__(self):
    super(Morlet,self).__init__()
def forward(self,x):
    x=(torch.cos(1.75*x))*(torch.exp(-0.5*x*x))
    return x

morlet=Morlet()

class WNN(nn.Module):
def __init__(self):
    super(WNN,self).__init__()
    self.a1=torch.nn.Parameter(torch.randn(64,requires_grad=True))
    self.b1=torch.nn.Parameter(torch.randn(64,requires_grad=True))
    self.layer1=nn.Linear(30,64,bias=False)
    self.out=nn.Linear(64,1)
def forward(self,x):
    x=self.layer1(x)
    x=(x-self.b1)/self.a1
    x=morlet(x)
    out=self.out(x)
    return out
wnn=WNN()

optimizer = torch.optim.Adam([{'params': wnn.layer1.weight, 'weight_decay':0.01},
                          {'params': wnn.out.weight, 'weight_decay':0.01},
                          {'params': wnn.out.bias, 'weight_decay':0},
                          {'params': wnn.a1, 'weight_decay':0.01},
                          {'params': wnn.b1, 'weight_decay':0.01}])
criterion = nn.MSELoss()

for epoch in range(10):
prediction_test_list=[]
running_loss_train=0
running_loss_test=0
for i,(x1,y1) in enumerate(trainloader):
    prediction_train=wnn(x1)
    #print(prediction_train)
    loss_train=criterion(prediction_train,y1)
    #print(loss_train)
    optimizer.zero_grad() 
    loss_train.backward() 
    optimizer.step()
    running_loss_train+=loss_train.item()   
    #print(running_loss_train)
tr_loss=running_loss_train/train_set_y_array.shape[0]
for i,(x2,y2) in enumerate(testloader):
    prediction_test=wnn(x2)
    #print(prediction_test)
    loss_test=criterion(prediction_test,y2)
    #print(loss_test)
    running_loss_test+=loss_test.item()
    print(running_loss_test)
    prediction_test_list.append(prediction_test.detach().cpu())
ts_loss=running_loss_test/test_set_y_array.shape[0]

print('Epoch {} Train Loss:{}, Test Loss:{}'.format(epoch+1,tr_loss,ts_loss))    

test_set_y_array_plot=test_set_y_array*(dataset.max()-dataset.min())+dataset.min()
prediction_test_np=torch.cat(prediction_test_list).numpy()
prediction_test_plot=prediction_test_np*(dataset.max()-dataset.min())+dataset.min()

plt.plot(test_set_y_array_plot.flatten(),'r-',linewidth=0.5,label='True data')
plt.plot(prediction_test_plot,'b-',linewidth=0.5,label='Predicted data')

plt.legend()
plt.show()

print('Finish training')

Вывод был:

Epoch 1 Train Loss:nan, Test Loss:nan

И на графике были только достоверные данные, как показано на рисунке.

Ahmed Ragab · Answer 1 · 14 апреля 2019

Снижение веса применяет регуляризацию L2 к изученным параметрам, бросая быстрый взгляд на ваш код, здесь вы используете веса a1 в качестве деноменаторов x=(x-self.b1)/self.a1 с затуханием веса 0,01, это может привести к устранению некоторых изэти a1 веса будут равны нулю, и каковы результаты деления на ноль?

При обучении нейронной сети в PyTorch потеря - это «нань»

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

При обучении нейронной сети в PyTorch потеря - это «нань»

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы