Проблема относительно весов и уклонов в CNN - PullRequest
1 голос
/ 09 мая 2019

Я сейчас изучаю CNN.

До сих пор я понял следующее:

  1. Передаем изображение в качестве ввода.
  2. В 1-м слое Convolution мы применяем все фильтры к 2-му изображению и применяем функцию активации, максимально увеличивая пул изображения, чтобы уменьшить размерность и передать вывод на следующий слой.
  3. В следующем слое мы повторяем процесс и передаем вывод в полностью подключенный слой.
  4. Этот слой тогда действует как основная нейронная сеть и предсказывает результат.

Я понимаю о весах и смещениях в Полностью связанных слоях на более поздних этапах, но я не могу понять, как мы назначаем веса начальным слоям свертки в CNN?

Мы назначаем веса только для полностью подключенных слоев? Или мы должны присвоить веса слою свертки определенным образом?

1 Ответ

0 голосов
/ 09 мая 2019

Хорошо, во-первых, я призываю вас продолжать читать о CNN!

Я постараюсь объяснить, что он на самом деле делает. CNN обычно делятся на две части. Первая часть состоит из сверточных слоев и пулов. Они действуют как глаза и учатся видеть разные вещи. Веса слоев конвоя - это значения окна, которые скользят по входам, они должны быть инициализированы так же, как веса полностью связанного слоя, так же, как и смещение. Вторая часть CNN - полностью соединенные слои, добавленные в конце. Они действуют как мозг и используют то, что «глаза» видят для классификации.

Новые веса и смещения фильтров рассчитываются с обратным распространением так же, как если бы это была полностью подключенная сеть.

Надеюсь, я объяснил это немного яснее. Если у вас есть еще вопросы, не стесняйтесь спрашивать.

Приветствие.

...