Функция определения размера ядра и активации в Keras - PullRequest
1 голос
/ 26 мая 2020

Я все еще учусь адаптироваться с использованием Keras (извините, если вопрос может быть глупым). Как говорится в заголовке, иногда я обнаруживал эти похожие коды при построении модели Conv2D или Conv3D в Keras:

x = Conv2D(16, 3, activation='relu', padding='same')(input_img)
x = Conv2D(16, (3, 3), activation='relu', padding='same')(input_img)
x = Conv3D(16, (3, 3, 3), activation='relu', padding='same')(input_img)

Я просто не уверен в этом, но я считаю, что он создает такой же размер ядра. Или это неправильно? а также я часто обнаруживал, что при создании модели последнего слоя использовалась функция активации «Sigmoid» или «Softmax», например:

x = Dense(784, activation='sigmoid')(x)
x = Dense(784, activation='softmax')(x)

Когда лучше всего использовать функцию активации Sigmoid / Softmax?

Ответы [ 2 ]

1 голос
/ 26 мая 2020

Сверточное ядро ​​(фильтр) зависит от типа свертки. Если вы используете изображения, вам необходимо использовать сверточный 2D-слой. С другой стороны, если, например, это видео, 3D будет правильным решением.

В аргументе ядра вы должны указать размер, который будет иметь этот фильтр, то есть какой он будет в каждом из измерений свертки.

Что касается функций активации, вам нужно будет оценить, какой тип данных вы обрабатываете. В идеале, если вы обрабатываете данные мультикласса, выходной слой должен иметь функцию softmax. В промежуточных слоях сигмовидная функция работает хорошо, как ReLU или любой другой. Но всегда на основании ваших данных. Некоторые из них более агрессивны, чем другие.

1 голос
/ 26 мая 2020

Параметр размера ядра может принимать целое число значения кортежа. если это целое число, это значение применяется ко всем сторонам ядра.
Итак, в первых двух примерах это ядро ​​3x3 2d, в последнем - ядро ​​3x3x3 3d.

Вы будет использовать softmax, если у вас есть несколько классов на выходе, но предсказанное значение может принадлежать только одному классу. Softmax используется, когда у вас есть 1 или несколько выходных классов, и прогнозируемое значение может принадлежать любому количеству этих классов.

...