Преимущество длинных пропущенных соединений (термин, используемый для этих длинных соединений) было изучено Drozdal et al. (https://arxiv.org/pdf/1608.04117.pdf), и было показано, что он улучшает градиентный поток и, следовательно, сохраняет значения весовых матриц стабильными. Это своего рода волнообразное объяснение, но оно лучшее, которое мы получили. Однако оно улучшает результаты в задачах сегментации.
Операция кадрирования используется в этом примере, поскольку автор использует допустимые свертки, которые уменьшают выходной размер и, следовательно, размер больше не подходит. В Tensorflow вы будете использовать что-то вроде tf.image.resize_images
, чтобы получить те же размеры ширины по высоте, что и ваши карты объектов в обширной части, а затем использовать tf.concat
, чтобы объединить карты объектов вдоль оси канала (обычно 4-я ось в макете BHWC).