Это называется блоком «сжатие и возбуждение» или «SE» (см. Статью Ху и др.). Целью этого блока является взвешивание каналов предыдущего уровня на основе некоторого «глобального» понимания важности каждого канала и зависимостей между каналами. См. Следующий рисунок (из статьи):
![figure 1 from the](https://i.stack.imgur.com/df63P.png)
и, в деталях, разница между остаточным соединением и соединением «SE» (опять же, рисунок из статьи):
![figure 3 from the](https://i.stack.imgur.com/6uGDc.png)
В частности, в отправленном вами grpah кажется, что они используют свертки 1x1 pointwize вместо полностью связанных слоев, но идея аналогичная.