Сверточные нейронные сети - теория - PullRequest
0 голосов
/ 05 мая 2020

Прошу прощения за этот глупый вопрос, но, немного подумав, я все еще не понимаю его:

По словам Хорди Торреса (см. здесь ), если мы посмотрите на изображение размером 28x28 = 784 пикселей, тогда один из способов реализовать это - позволить одному нейрону скрытого слоя узнать о 5x5 = 25 пикселей входного слоя:

asdfasdf

Однако, как он объясняет это:

Немного анализируя предложенный нами конкретный случай, мы отмечаем, что если у нас есть вход 28 × 28 пикселей и окно 5 × 5, это определяет пространство 24 × 24 нейронов в первом скрытом слое, потому что мы можем переместить окно только 23 нейрона вправо и 23 нейрона вниз, прежде чем коснуться правой (или нижней) границы ввода образ. Мы хотели бы указать читателю, что мы сделали предположение, что окно смещается на 1 пиксель вперед как по горизонтали, так и по вертикали, когда начинается новая строка. Следовательно, на каждом шаге новое окно перекрывает предыдущее, за исключением этой строки пикселей, которую мы увеличили. скрытый слой? Поскольку я беру 5x5 windows (в них 25 пикселей из 784), я подумал, что нам вообще понадобится 785/25 = 32 нейрона. То есть, разве один нейрон скрытого слоя не узнает свойство 25 пикселей? Видимо, нет, но я действительно запутался.

1 Ответ

0 голосов
/ 06 мая 2020

Предполагается, что неперекрывающиеся сегменты 5x5, но это не так. В этом примере первый вывод получается из строк 1–5, столбцов 1–5 ввода. В следующем используются строки 1–5, столбцы 2–6, строки 1–5, столбцы 24–28, затем строки 2–6, столбцы 1–5 и т.д. c. et c. до строк 24-28, столбцов 24-28. Это называется «шагом» 1.

...