Что является выходом сегментированной c сети сегментации?
UNet (той, что в примере) и, по существу, любой другой сети, которая имеет дело с Семанти c Сегментация выводить на выходе изображение, размер которого пропорционален входному изображению и в котором каждый пиксель классифицируется как один из возможных классов, указанных .
Для двоичной классификации обычно необработанный вывод представляет собой одноканальное плавающее изображение со значениями в [0,1]
, которое должно быть пороговым при 0.5
, чтобы получить двоичную маску «переднего плана». Также возможно, что сеть обучается неявно с двумя классами (передний план / фон), в этом случае читайте дальше, как обращаться с выходом для классификации с несколькими классами.
Для классификации с несколькими классами необработанный выходное изображение имеет N каналов, по одному на класс, со значением по индексу [x, y, c]
, равным счету для пикселя (представьте, что вероятность того, что пиксель x,y
будет принадлежать классу c
, хотя в принципе оценки не должны быть вероятностями). Для каждого пикселя выбранный класс является одним из каналов с наивысшей оценкой.
Затем изображения могут быть подвергнуты последующей обработке (например, их выравнивание и присвоение каждой метке класса пикселей " «победный класс», как это, кажется, имеет место для примера, на который вы ссылаетесь (если вы посмотрите на реализацию labelVisualize()
, они используют коды классов с точным отображением цветов).