Я читаю книгу по изучению Python от Франсуа Шоле.На странице 128 автор обсуждает проблему наличия непрерывного слоя Conv2d вместо слоя с максимальным пулом.Мой вопрос из следующего абзаца. Я не понимаю, откуда взялся 7X7?
Это не способствует изучению пространственной иерархии объектов.Окна 3 × 3 в третьем слое будут содержать только информацию, поступающую из окон 7 × 7 при первоначальном вводе.Шаблоны высокого уровня, усвоенные коннетом, все еще будут очень малы по отношению к начальному вводу, что может быть недостаточно для обучения классификации цифр (попробуйте распознать цифру, только глядя на нее через окна размером 7 × 7 пикселей!).Нам нужно, чтобы объекты из последнего слоя свертки содержали информацию о совокупности входных данных.
Layer (type) Output Shape Param #
================================================================
conv2d_4 (Conv2D) (None, 26, 26, 32) 320
________________________________________________________________
conv2d_5 (Conv2D) (None, 24, 24, 64) 18496
________________________________________________________________
conv2d_6 (Conv2D) (None, 22, 22, 64) 36928
================================================================
Total params: 55,744
Trainable params: 55,744
Non-trainable params: 0