Я много читал о коннетах, но все же пропускаю важную часть.
Допустим, у нас есть слой conv2D с 32 фильтрами:
Я понимаю, что веса этих фильтров инициализируются случайным образом вВ начале и в процессе обучения эти фильтры формируются.Таким образом, на первом уровне они начинают обнаруживать края.
А теперь после объединения у нас есть еще один извилистый слой (скажем, 32 фильтра снова), который будет применять фильтры к результату предыдущего слоя.
Таким образом, слой 2 будет применять 32 фильтра к ЛЮБОМ из этих 32 выходов из первого слоя. Я видел очень много примеров этих карт характеристик: первый слой производит изображения краев, на следующем слое изображения - формы, уши,нос и тд.Мой вопрос: как это возможно?
Если слой 2 применяет фильтры к результату слоя 1, а результат слоя 1 - это ребра, то как вы получаете форму из ребра?
Я явно что-то здесь упускаю, пожалуйста, помогите мне понять, как возможен каждый следующий слой в сети, производящий более богатые объекты, такие как формы, глаза, лицо, если он использует продукцию из предыдущего слоя, где объекты - это просто линии и края?
Есть ли какая-то информация, сливающаяся во время процесса, который я пропускаю, или это нечто большее?
Заранее спасибо