Как разделить модель resnet50 сверху и снизу? - PullRequest
0 голосов
/ 16 января 2019

Я использую keras предварительно обученную модель с include_top=False, но я также хочу удалить один повторный блок из top и один из bottom. Для vgg net это просто из-за прямых связей в слоях, но в resnet архитектура сложна из-за пропуска соединения, поэтому прямой подход не подходит.

Может ли кто-нибудь порекомендовать какой-либо ресурс или сценарий для этого?

renet = tf.keras.applications.resnet50.ResNet50(include_top=False, weights='imagenet')

1 Ответ

0 голосов
/ 16 января 2019

Если вы не правильно поняли, вы хотите удалить первый блок и последний.

Мой совет - использовать resnet.summary (), чтобы иметь возможность визуализировать все названия модели. Или даже лучше, если у вас есть тензорная доска, чтобы ясно видеть отношения.

Хотя вы можете знать, что завершение блока в Остаточной сети является суммой и только после активации. Активация будет тем слоем, который вы хотите получить.

Имена блоков аналогичны res2a ... Цифра 2 обозначает блок, а буква - «субблок».

На основе архитектуры Resnet50:

enter image description here

Если я хочу удалить первый остаточный блок, я должен искать конец res2c. В этом случае я нашел это:

activation_57 (Activation) (None, 56, 56, 64) 0 bn2c_branch2a [0] [0]
__________________________________________________________________________________________________
res2c_branch2b (Conv2D) (None, 56, 56, 64) 36928 activation_57 [0] [0]
__________________________________________________________________________________________________
bn2c_branch2b (BatchNormalizati (None, 56, 56, 64) 256 res2c_branch2b [0] [0]
__________________________________________________________________________________________________
activation_58 (Activation) (None, 56, 56, 64) 0 bn2c_branch2b [0] [0]
__________________________________________________________________________________________________
res2c_branch2c (Conv2D) (None, 56, 56, 256) 16640 activation_58 [0] [0]
__________________________________________________________________________________________________
bn2c_branch2c (BatchNormalizati (None, 56, 56, 256) 1024 res2c_branch2c [0] [0]
__________________________________________________________________________________________________
add_19 (Add) (None, 56, 56, 256) 0 bn2c_branch2c [0] [0]
                                                                 activation_56 [0] [0]
__________________________________________________________________________________________________
activation_59 (Activation) (None, 56, 56, 256) 0 add_19 [0] [0]
__________________________________________________________________________________________________
res3a_branch2a (Conv2D) (None, 28, 28, 128) 32896 activation_59 [0] [0]

Входным слоем является res3a_branch2a. В этой форме я прыгаю первый блок остатков.

activation_87 (Activation)      (None, 14, 14, 256)  0           bn4f_branch2a[0][0]              
__________________________________________________________________________________________________
res4f_branch2b (Conv2D)         (None, 14, 14, 256)  590080      activation_87[0][0]              
__________________________________________________________________________________________________
bn4f_branch2b (BatchNormalizati (None, 14, 14, 256)  1024        res4f_branch2b[0][0]             
__________________________________________________________________________________________________
activation_88 (Activation)      (None, 14, 14, 256)  0           bn4f_branch2b[0][0]              
__________________________________________________________________________________________________
res4f_branch2c (Conv2D)         (None, 14, 14, 1024) 263168      activation_88[0][0]              
__________________________________________________________________________________________________
bn4f_branch2c (BatchNormalizati (None, 14, 14, 1024) 4096        res4f_branch2c[0][0]             
__________________________________________________________________________________________________
add_29 (Add)                    (None, 14, 14, 1024) 0           bn4f_branch2c[0][0]              
                                                                 activation_86[0][0]              
__________________________________________________________________________________________________
activation_89 (Activation)      (None, 14, 14, 1024) 0           add_29[0][0]   

Если я хочу удалить последний блок остатков, я должен искать конец res4. Это активация_89.

Делая эти надрезы, мы получили бы эту модель:

enter image description here

resnet_cut = Model(inputs=resnet.get_layer('res3a_branch2a'), outputs=resnet.get_layer('activation_89'))
...