Pytorch - Как выполнить вывод модели после прореживания модели без файла model.py? - PullRequest
0 голосов
/ 19 ноября 2018

У меня есть модель pytorch со следующей структурой сети.

from __future__ import print_function
import argparse
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets, transforms

class lenet_mnist(nn.Module):
    def __init__(self):
        super(lenet_mnist, self).__init__()
        self.cuda()
        self.conv1 = nn.Conv2d(1, 16, kernel_size=3,padding=1)
        self.relu1 = nn.ReLU(inplace=True)
        self.relu2 = nn.ReLU(inplace=True)
        self.relu3 = nn.ReLU(inplace=True)
        self.maxpool1 = nn.MaxPool2d(kernel_size=2, stride=2)
        self.maxpool2 = nn.MaxPool2d(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2d(16, 32, kernel_size=5,padding=2)
        self.conv2_drop = nn.Dropout2d()
        self.fc1 = nn.Linear(1568, 256)
        self.fc2 = nn.Linear(256, 10)

    def forward(self,x):
        #x = x.to(torch.device("cuda:0"))
        out = self.conv1(x)
        out = self.maxpool1(out)
        out = self.relu1(out)
        out = self.conv2(out)
        out = self.conv2_drop(out)
        out = self.maxpool2(out)
        out = self.relu2(out)
        out = out.view(-1,1568)
        out = self.fc1(out)
        out = self.fc2(out)
        return out 

Я обучаю эту модель и удаляю несколько каналов в модели, например, я сделал self.conv2 как (in=16,out=24). Я перезагрузил модель state_dict и изменил модель для новой структуры.

Теперь я пытаюсь выполнить вывод модели, но pytorch по-прежнему выбирает старый файл model.py, в котором определена исходная структура. Как мне перестать pytorch искать model.py?

Редактировать: (дополнительная информация) Для прореживания модели я просто получаю state_dict модели, редактирую тензоры, удаляя в ней несколько каналов, а затем использую load_state_dict в модели, чтобы снова загрузить модель. Я также изменяю model._parameters с обновленными весами и смещением. Я использую эту модель для запуска прямого прохода. Во время работы я получаю сообщение о несоответствии размеров в слое out.view. И обратная трассировка показывает, что pytorch читает модель из файла model.py, в котором присутствует приведенный выше фрагмент кода.

...