Какова связь между пространственным разрешением изображения и размером архитектуры CNN? - PullRequest
5 голосов
/ 13 февраля 2020

Я работаю над различными пространственными разрешениями изображения и думал реализовать архитектуру CNN для каждого пространственного разрешения, поскольку изменение размеров изображений влияет на детали объекта. Существуют ли какие-либо конкретные отношения, которые можно количественно объяснить между размером сети и пространственным разрешением изображения?

Ответы [ 2 ]

0 голосов
/ 26 февраля 2020

Существует зависимость между размером сети и разрешением входа, хотя она немного косвенная. Увеличение размера сети (т. Е. Количества каналов и глубины сети) и разрешения входного сигнала являются сложными вычислениями. В недавней статье предлагается Efficien tNet, который параметризует номер канала, глубину и входное разрешение одним параметром.

По сути, если у вас есть только столько вычислительной мощности, которую вы можете потратить, вы должен выбрать, как распределить его по размеру ядра, глубине и разрешению. Требуемая вычислительная мощность линейно пропорциональна глубине, длине каждой входной стороны и квадрату номера канала.

0 голосов
/ 19 февраля 2020

Ввод изображения представлен как H x W x C, где H, W и C - высота, ширина и канал соответственно. Размер вашей сверточной сети, т. Е. (Количество параметров), зависит только от количества и размера сверточных слоев, которые у вас есть. Каждый сверточный слой добавляет (Hk * Wk * Cin + 1) * Cout параметры, где Hk и Wk - высота и ширина сверточного ядра, Cin входных каналов и Cout выходных каналов.

Входное изображение может реально влиять только на первый сверточный слой. Даже в этом случае его пространственное измерение не будет влиять на слой. Но количество каналов будет.

Рассмотрим следующий пример:

У меня есть 3-слойный CNN, состоящий из двух 3 × 3 конв и одного 1 × 1 конв, сконструированный следующим образом:

Вход (В x Ш x 3) -> Conv1 (3 x 3 x 3) -> Conv2 (3 x 3 x 5) -> Conv3 (1 x 1 x 7)

Вес первого слоя конвона :

Hk = 3, Wk = 3, Cin = 3, Cout = 3

Количество параметры в 1-м слое = (Hk * Wk * Cin + 1) * Cout = (3 * 3 * 3 + 1) * 3 = 84 параметра

Вес второго слоя конвона :

Hk = 3, Wk = 3, Cin = 3, Cout = 5

Количество параметров во 2-м слое = (Hk * Wk * Cin + 1) * Cout = (3 * 3 * 3 + 1) * 5 = 140 параметров

Вес третьего слоя конвона :

Hk = 1, нед. = 1, Cin = 5, Cout = 7

Количество параметров в 3-м слое = (Hk * Wk * Cin + 1) * Cout = (1 * 1 * 5 + 1) * 7 = 42 параметра

Общее количество параметров в сети = 84 + 42 + 140 = 266 параметров .

Как видите, пространственные затемнения входного изображения (В x Ш) не влияют на размер сети, но количество каналов изображения делает.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...