Это код для слоя в 3D CNN, где мой ввод - видеокадры.Мне трудно понять, что означают параметры.
net = slim.conv3d(net, 64, [1, 3, 3], scope='conv32')
net = PReLU(net, 'conv32_activation')
net = tf.nn.max_pool3d(net, strides=[1, 1, 2, 2, 1], ksize=[1, 1, 3, 3, 1], padding='VALID', name='pool3')
Относится ли [1,3,3] к размеру моего фильтра?а какие 5 чисел в ксизе?