В блоке узких мест ren snet -50 мы используем conv1x1 (предыдущий блок out, 64), conv3x3 (64,64), conv1x1 (64,256), а затем мы повторяем.
Почему мы увеличиваем размеры только в третьем слое conv1x1, чтобы уменьшить его в следующем блоке?
Это слой узких мест, см. Ответ на этот вопрос:
https://ai.stackexchange.com/a/4887
и этот вопрос:
https://stats.stackexchange.com/questions/205150/how-do-bottleneck-architectures-work-in-neural-networks
По сути, это сокращение количества объектов, особенно для свертки 3x3.