Это просто выбор гиперпараметра.Такой выбор может быть сделан путем перекрестной проверки поиска гиперпараметров, что означает обучение нескольких моделей с различными вариантами выбора гиперпараметров и выяснение, кто добился наилучших результатов на наборе проверки.В частности, для свертки 3х3 это стало популярным со времен бумаги VGG , в которой предполагалось, что укладка большого количества сверток 3х3 (которая считается небольшим ядром) может дать хорошую производительность.