Полная свертка для градиента потерь по отношению к входам слоя свертки - PullRequest
0 голосов
/ 26 января 2020

У меня есть вопрос относительно шага обратного распространения для входов уровня CNN. Итак, у меня есть следующие настройки:

Свертка на входах 8X14X14 (8 каналов) с фильтрами 16X5X5. Каждый из 16 фильтров сворачивает все 8 каналов на входах и суммирует их. Мы получаем карты 16X10X10. Я понимаю, что после «полной свертки» относительно входов 8X14X14 я должен получить матрицу градиента 8X14X14. Однако, похоже, что все эти 8 матриц градиента будут иметь один и тот же градиент, потому что каждый из 8 входов имеет тот же вес, что и их локальная производная. Это правильно?

...