Кто-нибудь, пожалуйста, объясните разницу между двумерной и трехмерной свертками в CNN (Deep Learning) с использованием 3D или мультиспектральных изображений?
все операции свертки имеют отступы для сохранения выходного размера [w, h]
2D Convolution
входной размер = [w, h]
conv filter = [n, n]
выходной размер = [w, h]
3D свертка
входной размер = [w, h, c]
conv filter = [n, n, d]
выходной размер = [w, h, c ']
2D сверткадля 3D-ввода (обычно используется эта форма)
conv filter = [n, n, c]
выходной размер =[w, h]
, если вы хотите получить размер вывода с помощью [w, h, c '], вам нужна операция c' times.