Question

Я довольно плохо знаком с глубоким изучением, так что, надеюсь, это не выглядит как «глупый» вопрос.

Нам дали набор из 1000 обучающих изображений и 100 проверочных изображений, каждое из которых содержит круг, прямоугольник и треугольник. Каждое изображение также имело соответствующую метку, содержащую положение (x, y) соответствующего центра круга плюс радиус круга. Цель состояла в том, чтобы создать модель, которая могла бы идентифицировать и заполнять круги.

Я написал довольно простую сеть CNN:

class CircleNet(nn.Module):    # nn.Module is parent class  
def __init__(self):
    super(CircleNet, self).__init__()  #calls init of parent class

    # The convolution layers were chosen to keep dimensions of input image: (I-F+2P)/S +1= (128-3+2)/1 + 1 = 128

    # Our images are RGB, so input channels = 3. Use 12 filters for first 2 convolution layers, then double
    self.conv1 = nn.Conv2d(in_channels=3, out_channels=12, kernel_size=3, stride=1, padding=1)
    self.conv2 = nn.Conv2d(in_channels=12, out_channels=12, kernel_size=3, stride=1, padding=1)
    self.conv3 = nn.Conv2d(in_channels=12, out_channels=24, kernel_size=3, stride=1, padding=1)
    self.conv4 = nn.Conv2d(in_channels=24, out_channels=32, kernel_size=3, stride=1, padding=1)



    #Pooling to reduce sizes, and dropout to prevent overfitting
    self.pool = nn.MaxPool2d(kernel_size=2)
    self.relu = nn.ReLU()

    self.drop = nn.Dropout2d(p=0.25)
    /// self.norm1 = nn.BatchNorm2d(12)
   /// self.norm2 = nn.BatchNorm2d(24)

    # There are 2 pooling layers, each with kernel size of 2. Output size: 128/(2*2) = 32

    # Have 3 output features, corresponding to x-pos, y-pos, radius. 
    self.fc = nn.Linear(in_features=32 * 32 * 32, out_features=3)

def forward(self, x):
    """
    Feed forward through network
    Args:
        x - input to the network

    Returns "out", which is the network's output
    """

    #----------------------------------------------
    # implementation needed here 
    #----------------------------------------------

    #Convolution 1
    out = self.conv1(x)
    out = self.pool(out)
    out = self.relu(out)
   /// out = self.norm1(out)

    #Convolution 2
    out = self.conv2(out)
    out = self.pool(out)
    out = self.relu(out)
  // out = self.norm1(out)

    #Convolution 3
    out = self.conv3(out)
    out = self.drop(out)

    #Convolution 4
    out = self.conv4(out)
    out = F.dropout(out, training=self.training)


    out = out.view(-1, 32 * 32 * 32)
    out = self.fc(out)


    return out


//# Use an "Adam" optimizer to adjust weights
optimizer = optim.Adam(model.parameters(), lr=0.001, weight_decay =0.01)
criterion = nn.MSELoss()

Загрузчик данных PyTorch использовался для создания пакетов размером 32, и сеть обучалась в течение 10 эпох.

Я заметил, что всякий раз, когда я добавлял BatchNormalization в модель, результаты были хуже. Это произошло независимо от того, поместил ли я пакетную нормализацию до или после слоя Relu. Мне интересно, необычно ли это, и в каких ситуациях нормализация пакетов может дать худшие результаты?

Кроме того, мне интересно, есть ли какие-нибудь полезные методы увеличения данных, которые стоит попробовать? Первоначально я думал, может быть, пытаясь повернуть изображения, но теперь я не уверен, что это не увеличит переоснащение?

Любые объяснения / подсказки будут с благодарностью!

Проблема регрессии с использованием CNN - с использованием увеличения данных и пакетной нормализации

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Проблема регрессии с использованием CNN - с использованием увеличения данных и пакетной нормализации

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы