У меня есть модель pytorch со следующей структурой сети.
from __future__ import print_function
import argparse
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms
class lenet_mnist(nn.Module):
def __init__(self):
super(lenet_mnist, self).__init__()
self.cuda()
self.conv1 = nn.Conv2d(1, 16, kernel_size=3,padding=1)
self.relu1 = nn.ReLU(inplace=True)
self.relu2 = nn.ReLU(inplace=True)
self.relu3 = nn.ReLU(inplace=True)
self.maxpool1 = nn.MaxPool2d(kernel_size=2, stride=2)
self.maxpool2 = nn.MaxPool2d(kernel_size=2, stride=2)
self.conv2 = nn.Conv2d(16, 32, kernel_size=5,padding=2)
self.conv2_drop = nn.Dropout2d()
self.fc1 = nn.Linear(1568, 256)
self.fc2 = nn.Linear(256, 10)
def forward(self,x):
#x = x.to(torch.device("cuda:0"))
out = self.conv1(x)
out = self.maxpool1(out)
out = self.relu1(out)
out = self.conv2(out)
out = self.conv2_drop(out)
out = self.maxpool2(out)
out = self.relu2(out)
out = out.view(-1,1568)
out = self.fc1(out)
out = self.fc2(out)
return out
Я обучаю эту модель и удаляю несколько каналов в модели, например, я сделал self.conv2
как (in=16,out=24
). Я перезагрузил модель state_dict
и изменил модель для новой структуры.
Теперь я пытаюсь выполнить вывод модели, но pytorch
по-прежнему выбирает старый файл model.py
, в котором определена исходная структура. Как мне перестать pytorch
искать model.py
?
Редактировать: (дополнительная информация)
Для прореживания модели я просто получаю state_dict модели, редактирую тензоры, удаляя в ней несколько каналов, а затем использую load_state_dict в модели, чтобы снова загрузить модель. Я также изменяю model._parameters с обновленными весами и смещением. Я использую эту модель для запуска прямого прохода. Во время работы я получаю сообщение о несоответствии размеров в слое out.view. И обратная трассировка показывает, что pytorch читает модель из файла model.py, в котором присутствует приведенный выше фрагмент кода.