Нет общего ответа на этот вопрос, нет общепринятого метода определения этих гиперпараметров.Традиционный подход заключается в поиске аналогичных проблем и архитектур глубокого обучения, которые, как уже было показано, работают.Чем подходящая архитектура может быть разработана экспериментальным путем.Однако обычные размеры ядра составляют 3x3, 5x5 и 7x7.
В противном случае, есть бумаги об этом 1 и 2 , вы можете посмотреть на искусствовыбора гиперпараметров в CNN.