В некоторых доменах голова - это термин для начала или начала чего-либо.
В этом домене все по-другому.
Во многих задачах в области компьютерного зрения вы обычно используете «магистраль», которая обычно проходит предварительную подготовку в ImageNet. Таким образом, магистраль используется в качестве экстрактора объектов, который дает представление карты объектов для входных данных.
Теперь, когда у вас есть такая карта объектов, вам нужно выполнить реальную задачу, такую как обнаружение, сегментация и т. Д.
Обычно это делается путем наложения «головы обнаружения» на карту (ы) объектов, поэтому это похоже на голову, прикрепленную к магистрали.
В случае обнаружения объекта вам потребуются два типа вывода: классификационная достоверность и ограничивающие рамки. Они могут быть двумя разными, разъединенными головками (например, RetinaNet) или одной головкой, которая вычисляет оба выхода (например, SSD). В обоих случаях вам необходимо указать точный способ интерпретации выходных данных. Например, выходы регрессии ограничивающего прямоугольника, они относительно якоря? Или, может быть, относительно всего изображения? Классификация конфиденциальных данных - вы используете softmax на выходе для получения конфиденциальных данных? и т.д.