Возможные регрессионные потери при обнаружении объекта - PullRequest
0 голосов
/ 03 января 2019

Многие алгоритмы обнаружения объектов предсказывают ограничивающие прямоугольники как (xmin, ymin, xmax, ymax), означающие верхний левый и нижний правый угол ограничивающего прямоугольника. Кроме того, во избежание взрывающихся градиентов в большинстве работ предлагается плавная потеря L1 или просто потеря L1.

У меня вопрос, есть ли успешные попытки других подходов?

Например

  • Прогнозирование верхней левой точки (x, y), ширины и высоты поля.
  • Прогнозирование центральной точки (x, y), ширины и высоты рамки.
  • Прогнозирование центральной точки (x, y), размера и соотношения сторон окна.
  • Предсказать центральную точку (x, y), размер и загар -1 (соотношение сторон)

Кроме того, некоторые из этих параметров могут включать в себя различные значения / веса для некоторых атрибутов. Например. может быть более важно найти хорошую центральную точку и размер, чем хорошо подогнанное соотношение сторон. Кроме того, было бы разумно использовать потери L1 для центральной точки, но L2 для размера или соотношения сторон. Есть ли какие-либо исследования по этой теме, о которых вы знаете?

Спасибо.

...