Question

Я прочитал статью, и авторы используют CNN по следующей схеме:

-----------------

Input image 30*30 => Feature maps => Feature maps =>  Feature maps => Feature maps
                       28 * 28          14*14            12*12            6*6
-----------------
            Filtring 5*3*3   downsampling 2*2    Filtring 5*3*3   downsampling 2*2

С моим пониманием у нас есть два фильтра 5 * 3, а последние 3 соответствуют каналу RGB, поэтому 3, это правильно?

MasterEND · Answer 1 · 20 апреля 2020

What they are trying to say is that:

First:
the conv is being done using 5 different 3x3 2d kernels
input 30x30 ==> output 5 different 28x28

Second:
max pool 2x2 ie the output dim becomes halved
input 28x28 ==> output 14x14

Third:
the conv is being done using 5 different 3x3 2d kernels
input 14x14 ==> output 5 different 12x12

Lastly:
max pool 2x2 ie the output dim becomes halved
input 12x12 ==> output 6x6

Pankaj Mishra · Answer 2 · 17 апреля 2020

это означает, что у вас есть 5 каналов (означает 5 фильтров / ядер) 3x3.

Я запутался с ядром или фильтром

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Я запутался с ядром или фильтром

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы