Как работают последовательные сверточные слои? - PullRequest
0 голосов
/ 22 января 2020

Если в моем первом свертке есть 64 фильтра, а во втором - 32 фильтра. Будет ли у меня:

1 изображение -> Conv (64 фильтра) -> 64 ImagesFiltred -> Conv (32 фильтра) -> 64 x 32 = 2048 отфильтрованных изображений

или:

1 Изображение -> Conv (64 фильтра) -> 64 ImagesFiltred -> Conv (32 фильтра) -> 32 изображения, отфильтрованные

Если это второй ответ: что происходит между 64 ImagesFiltred и второй Conv ??

Спасибо за ваш ответ, в не найти хороший учебник, который четко объяснить, это всегда ru sh ...

Ответы [ 2 ]

0 голосов
/ 23 января 2020

Здесь мы имеем архитектуру VGG-16

В VGG-16 у нас есть 4 свертки: 64, 128, 256 512 И в архитектуре мы увидели, что мы не у него 64 изображения, 64 * 128 изображений и т. д., но только 64 изображения, 128 изображений и т. д. c

Таким образом, хороший ответ был не первым, а вторым. И это подразумевает мои вторые вопросы:

«Что происходит между 64 ImagesFiltred и вторым Conv ??»

Я думаю, что между 64 conv и 32 conv они окончательно только 1 Фильтр, но на двухпиксельном кушетке, поэтому он делит толщину конуса на 2.

А между 64 конвой и 128 конвом они только 2 фильтра на одном пиксельном кушетке, так что умножьте на 2 толщину конв.

Я прав?

0 голосов
/ 22 января 2020

Ваш первый пункт верен. Свертки - это, по сути, способы изменения и извлечения признаков из данных. Мы делаем это путем создания m изображений, каждое из которых смотрит на определенный кадр исходного изображения. На этом первом сверточном слое мы затем берем n изображений для каждого извилистого изображения в первом слое.

SO: k1 * k2 будет общим количеством изображений.

Для достижения этой цели, свертка работает путем создания карт характеристик изображения. Когда у вас есть последовательные сверточные слои, вы создаете карты объектов с картами объектов. Т.е. если я начну с 1 изображения, и мой первый сверточный слой имеет размер 20, то у меня будет 20 изображений (точнее, карт объектов) в конце свертки 1. Затем, скажем, я добавляю вторую свертку размера 10. Что происходит Затем я делаю 10 карт функций для каждого 1 изображения. Таким образом, это будет 20 * 10 изображений = 200 карт объектов.

Скажем, например, у вас есть изображение 50x50 пикселей. Допустим, у вас есть сверточный слой с фильтром размером 5х5. Если у вас нет отступов или чего-либо еще), вы «скользите» по изображению и получаете средневзвешенное значение пикселей на каждой итерации слайда (в зависимости от вашего местоположения). Затем вы получите выходную карту объектов размером 5х5. Допустим, вы делаете это 20 раз (т.е. свертка 5x5x20). Затем вы получите 20 карт характеристик размером 5x5. На диаграмме, упомянутой в посте нейронной сети VGG ниже, на диаграмме показано только количество карт объектов, которые будут сделаны для входящих карт объектов, а не конечная сумма карт объектов.

Надеюсь, это объяснение было полным!

...