Как вы измените размер ваших входных изображений в pytorch? - PullRequest
0 голосов
/ 19 декабря 2018

Я создал сверточную нуральную сеть и хочу, чтобы она делала входные и выходные изображения, но когда я превращаю изображения в тензоры, они имеют неправильный размер:

RuntimeError: Expected 4-dimensional input for 4-dimensional weight [20, 3, 5, 5], but got 3-dimensional input of size [900, 1440, 3] instead 

как мне изменить размерностьфотографий ?и почему это нужно менять?и как мне сделать вывод изображения?Я пытался использовать

transform = transforms.Compose(
[transforms.ToTensor(),
 transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

для нормализации IMG, но это не изменило размер.вот мой nuralnet

    def __init__(self):
    super(Net, self).__init__()
    torch.nn.Module.dump_patches = True
    self.conv1 = nn.Conv2d(3, 20, 5)
    self.pool = nn.MaxPool2d(2, 2)
    self.conv2 = nn.Conv2d(20, 16, 5)
    self.fc1 = nn.Linear(16*5*5, 120)
    self.fc2 = nn.Linear(120, 84)
    self.fc3 = nn.Linear(84, 16*5*5)


def forward(self, x):
    x = self.pool(F.relu(self.conv1(x)))
    x = self.pool(F.relu(self.conv2(x)))
    x = x.view(-1, 16 * 5 )
    x = F.relu(self.fc1(x))
    x = F.relu(self.fc2(x))
    x = self.fc3(x)


    return x

здесь я получаю изображение и помещаю его в список:

for i in range(4):
l.append(ImageGrab.grab())

, а вот код, который превращает img в тензор

k=torch.from_numpy(np.asarray(l[1],dtype="int32" ))

1 Ответ

0 голосов
/ 20 декабря 2018

В итоге, согласно комментариям, которые вы и я разместили:

Ошибка связана с тем, что torch.nn поддерживает только мини-пакеты.Ввод должен быть в форме (batch_size, channels, height, width).Вы, кажется, пропускаете размер партии.Вы можете добавить .unsqueeze(0), чтобы добавить поддельный размер партии в первой позиции.

В дополнение к вышесказанному вам также придется изменить размеры изображения с [HxWxC] до [CxHxW].Это делается с помощью преобразования .ToTensor() в PyTorch.

Для решения проблемы несоответствия размера входного изображения вы можете использовать преобразование следующим образом:

transform = transforms.Compose(
                   [transforms.Resize((32,32)),
                    transforms.ToTensor(),
                    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
...