В работах Deeplab v1 и Deeplab V2 автор принял и изменил сеть VGG16 для задачи сегментации, такой как FCN. В документе говорится, что соответствующее восприимчивое поле (RF) составляет 224 * 224 (с добавлением нуля) и 404 * 404 пикселей (при сверточном применении).
Затем они изменили первый слой FC на 4 * 4 пространственного размера. Они говорят, что это уменьшило восприимчивое поле до 128 * 128 (с добавлением нуля) или 308 * 308 (при сверточном применении).
Мой вопрос:
- как понять разный размер рецептивного поля в разных режимах («заполнение нулями» и «применение сверточно»)? Соответствуют ли два значения разным слоям?
- Также, на мой взгляд, для слоя pool5 RF = 224 - это не правильное число, я думаю, правильное значение - 212, я прав?
Спасибо за помощь!