Я не совсем понимаю следующее:
В предложенном FCN для семантической сегментации Шелхамером и др. они предлагают межпиксельное прогнозирование для построения масок / точных положений объектов на изображении.
В слегка модифицированном варианте FCN для сегментации биомедицинских изображений, U-net , основное отличие, по-видимому, заключается в "конкатенации с соответственно обрезанной картой признаков из сокращающегося пути".
Теперь, почему эта особенность особенно важна для биомедицинской сегментации? Основные отличия, которые я могу отметить для биомедицинских изображений по сравнению с другими наборами данных, заключаются в том, что в биомедицинских изображениях нет такого богатого набора характеристик, определяющих объект, как для обычных повседневных объектов. Также размер набора данных ограничен. Но вдохновлена ли эта дополнительная особенность этими двумя фактами или какой-то другой причиной?