Может ли кто-нибудь объяснить мне концепцию или интуицию того, как ось глубины стала фильтром? - PullRequest
0 голосов
/ 19 июня 2020

В книге о сверточной нейронной сети, которую я изучал самостоятельно, автор упоминает, что

Операция свертки извлекает участки из входной карты признаков и применяет одно и то же преобразование ко всем этим патчам, создание выходной карты объектов. Эта выходная карта объектов по-прежнему является трехмерным тензором: у нее есть ширина и высота. Его глубина может быть произвольной, потому что глубина вывода является параметром слоя, и разные каналы на этой оси глубины больше не соответствуют определенным c цветам, как на входе RGB; скорее, они обозначают фильтры ».

Чего я не мог понять, так это того, что случилось с параметром глубины в выходной карте функций? Как он стал фильтром? Насколько я понял знаете, фильтры - это матрицы, применяемые для обнаружения краев, форм и т. д. c.

Кто-нибудь может объяснить?

1 Ответ

0 голосов
/ 19 июня 2020

Рассмотрим первый уровень сверточной сети, который принимает в качестве входных данных изображение RGB (то есть 3 канала) и выводит K карты характеристик (то есть тензор размером batch_size, K, width, height). Каждый отдельный канал среди этих K каналов создается собственным сверточным фильтром. То есть канал i создается фильтром с весами и смещением W_i, b_i. В результате, иногда в литературе вы можете увидеть это языковое злоупотребление: вместо того, чтобы произносить канал i-th из вывода, некоторые авторы просто произносят фильтр i-th.

...