(tf2 / tf.keras) Как может # params уменьшиться, если модель содержит другую модель - PullRequest
1 голос
/ 27 февраля 2020

У меня есть модель keras (не Layer) с именем Model A. Модель A содержит keras. Слои типов: Dense, Conv2D, AveragePooling2D, BatchNormalization, add, GlobalAveragePooling2D.

Вывод модели.summary ( ) выглядит следующим образом:

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
layer_type_1 (Layer_type_1)  multiple                  3776      
_________________________________________________________________
...                           ...                      ...
_________________________________________________________________
dense (Dense)                multiple                  1024      
=================================================================
Total params: 4,787,808
Trainable params: 4,782,496
Non-trainable params: 5,312
_________________________________________________________________

У меня есть другая модель keras (модель B), которая содержит модель A.

summary ():

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d (Conv2D)              multiple                  35        
_________________________________________________________________
model_A (ModelA)             multiple                  4787232   
=================================================================
Total params: 4,787,267
Trainable params: 4,781,955
Non-trainable params: 5,312
_________________________________________________________________

Интересно, как может общее число параметров в модели B на меньше , чем у модели A?

Поскольку модель B содержит модель A, она должна быть больше.

1 Ответ

1 голос
/ 27 февраля 2020

Я обнаружил, что это потому, что форма входа (для модели A) изменена с (W, D, 6) на (W, D, 5) из-за первого слоя Conv2D в модели B.

...