Ввод изображения представлен как H x W x C, где H, W и C - высота, ширина и канал соответственно. Размер вашей сверточной сети, т. Е. (Количество параметров), зависит только от количества и размера сверточных слоев, которые у вас есть. Каждый сверточный слой добавляет (Hk * Wk * Cin + 1) * Cout параметры, где Hk и Wk - высота и ширина сверточного ядра, Cin входных каналов и Cout выходных каналов.
Входное изображение может реально влиять только на первый сверточный слой. Даже в этом случае его пространственное измерение не будет влиять на слой. Но количество каналов будет.
Рассмотрим следующий пример:
У меня есть 3-слойный CNN, состоящий из двух 3 × 3 конв и одного 1 × 1 конв, сконструированный следующим образом:
Вход (В x Ш x 3) -> Conv1 (3 x 3 x 3) -> Conv2 (3 x 3 x 5) -> Conv3 (1 x 1 x 7)
Вес первого слоя конвона :
Hk = 3, Wk = 3, Cin = 3, Cout = 3
Количество параметры в 1-м слое = (Hk * Wk * Cin + 1) * Cout = (3 * 3 * 3 + 1) * 3 = 84 параметра
Вес второго слоя конвона :
Hk = 3, Wk = 3, Cin = 3, Cout = 5
Количество параметров во 2-м слое = (Hk * Wk * Cin + 1) * Cout = (3 * 3 * 3 + 1) * 5 = 140 параметров
Вес третьего слоя конвона :
Hk = 1, нед. = 1, Cin = 5, Cout = 7
Количество параметров в 3-м слое = (Hk * Wk * Cin + 1) * Cout = (1 * 1 * 5 + 1) * 7 = 42 параметра
Общее количество параметров в сети = 84 + 42 + 140 = 266 параметров .
Как видите, пространственные затемнения входного изображения (В x Ш) не влияют на размер сети, но количество каналов изображения делает.