Что такое хорошая функция потерь для локализации и классификации объектов с использованием cnn? - PullRequest
0 голосов
/ 04 июля 2018

Контекст: использование CNN для локализации объекта на изображении. Существует два вида объектов, представленных классами C1 и C2. Выход CNN - 6 узлов, то есть C1, C2, x, y, w, h. Где [C1, C2] = [0,1], если класс C2, и [1,0], если класс C1. x, y представляют центр ограничивающего прямоугольника, окружающего объект, а w, h представляют ширину и высоту ограничивающего прямоугольника.

Проблема: теперь я пытался вычислить классификацию кросс-энтропийных потерь softmax (т.е. на узлах C1, C2) и использовать потери L2 на узлах x, y, w и h. Проблема, с которой я сталкиваюсь, заключается в том, что одна потеря доминирует над другой, и их весовые коэффициенты для уравновешивания эффекта друг друга работают не очень эффективно. Кто-нибудь может предложить хорошую функцию потерь, которая учитывает как классификацию, так и локализацию.

Примечание: 1. На изображении постоянно присутствует объект. 2. Я попробовал потерю йоло и смотрю на другую потерю, которую люди могли бы найти полезной для такого рода приложений.

...