Я действительно запутался в использовании пакетной нормализации. Например, у меня есть (256,256)
изображение, и я тренирую свою сеть с batch_size = 4
. Мне нужна (4,64,64)
карта объектов для каждой партии, поэтому у меня есть следующая модель:
Conv1d(1,1,kernel_size = 1 , stride = 2, padding = 0)
BatchNorm1d(x)
Conv1d(1,1,kernel_size = 1, stride = 2,padding = 0)
BatchNorm1(x)
Для вышеприведенной модели, какой должен быть правильный номер для x
?
BatchNorm
выполняется, как правило, на оси канала. Однако требуемая карта объектов должна иметь размер (4,64,64)
. Установка x
в 1
не имеет смысла. Я не прав?
Также у меня есть один вопрос. В чем разница между выполнением batchNorm
на оси канала и на другой оси?