Пока я работал над реализацией архитектуры широкого перезапуска, у меня был один главный вопрос, касающийся вычисления N по статье широкий перезапуск :
В их реализации я обнаружил, что N вычисляется как:
N = (n - 4) / 6 # n is the number of layers
Но я не понимаю, почему мы вычитаем 4 из n?
Отражает ли n количество слоев в целом, включая сверточные слои, или это только число сверточных слоев?