Я могу рассчитать размер рецептивного поля 500 x 500 входного изображения для VGGNet.
Размеры рецептивного поля следующие.
Layer Name = conv1, Output size = 500, Stride = 1, RF size = 3
Layer Name = relu1_1, Output size = 500, Stride = 1, RF size = 3
Layer Name = conv1_2, Output size = 500, Stride = 1, RF size = 5
Layer Name = relu1_2, Output size = 500, Stride = 1, RF size = 5
Layer Name = pool1, Output size = 250, Stride = 2, RF size = 6
Layer Name = conv2_1, Output size = 250, Stride = 2, RF size = 10
Layer Name = relu2_1, Output size = 250, Stride = 2, RF size = 10
Layer Name = conv2_2, Output size = 250, Stride = 2, RF size = 14
Layer Name = relu2_2, Output size = 250, Stride = 2, RF size = 14
Layer Name = pool2, Output size = 125, Stride = 4, RF size = 16
Layer Name = conv3_1, Output size = 125, Stride = 4, RF size = 24
Layer Name = relu3_1, Output size = 125, Stride = 4, RF size = 24
Layer Name = conv3_2, Output size = 125, Stride = 4, RF size = 32
Layer Name = relu3_2, Output size = 125, Stride = 4, RF size = 32
Layer Name = conv3_3, Output size = 125, Stride = 4, RF size = 40
Layer Name = relu3_3, Output size = 125, Stride = 4, RF size = 40
Layer Name = pool3, Output size = 62, Stride = 8, RF size = 44
Layer Name = conv4_1, Output size = 62, Stride = 8, RF size = 60
Layer Name = relu4_1, Output size = 62, Stride = 8, RF size = 60
Layer Name = conv4_2, Output size = 62, Stride = 8, RF size = 76
Layer Name = relu4_2, Output size = 62, Stride = 8, RF size = 76
Layer Name = conv4_3, Output size = 62, Stride = 8, RF size = 92
Layer Name = relu4_3, Output size = 62, Stride = 8, RF size = 92
Layer Name = pool4, Output size = 31, Stride = 16, RF size = 100
Layer Name = conv5_1, Output size = 31, Stride = 16, RF size = 132
Layer Name = relu5_1, Output size = 31, Stride = 16, RF size = 132
Layer Name = conv5_2, Output size = 31, Stride = 16, RF size = 164
Layer Name = relu5_2, Output size = 31, Stride = 16, RF size = 164
Layer Name = conv5_3, Output size = 31, Stride = 16, RF size = 196
Layer Name = relu5_3, Output size = 31, Stride = 16, RF size = 196
Я смотрю только до conv5_3.
Например, если размер моего объекта составляет 150 x 150, а размер моего изображения - 500 x 500.
Могу ли я сказать, что карты объектов для более ранних слоев от conv1 до conv4_2 несут только частичные признаки моего объекта и от conv5_2 до conv5_3, они несут признаки почти всего объекта.
Верно ли мое мнение?
Но в conv5_3 мой output_size имеет размер только 31 x 31, поэтому я не могу представить, как он представляет весь объект на изображении, но каждый пиксель этого слоя conv5_3 представляет размер 196 x 196 исходного изображения 500 x 500 .
Верно ли мое мнение?