Я реализую U-Net для семантической сегментации изображений с 3 классами.Поскольку мои изображения сравнительно большие, я уменьшаю их до 0,75 от исходного размера.Предсказание и сегментация моих классов работает хорошо, за исключением того, что предсказания всегда сдвигаются на несколько пикселей по сравнению с местоположением истинной точки земного шара.На изображении ниже красный представляет основную правду, а зеленый - прогноз для класса A.
Это только подмножество всего изображенияи во всем изображении предсказание не всегда сдвигается в одном и том же направлении.
Так что мне интересно, возможно ли, что это связано с понижающей выборкой?Или это может быть артефактом заполнения в слоях с нисходящей сверткой и последующими слоями с нисходящей сверткой? * Как можно было бы оценить эффективность такого предсказания?
* Моя архитектура:
4x:
- DownConv (размер ядра = 3, отступ = 1)
- BatchNorm2d
- ReLU
4x
- UpConv (3, 1)
- BatchNorm2d
- ReLU
.