Я недавно изучал RetinaNet.Я прочитал оригинальную статью и некоторые связанные с ней и написал пост, в котором поделился тем, что узнал: http://blog.zenggyu.com/en/post/2018-12-05/retinanet-explained-and-demystified/. Однако у меня все еще есть некоторые недоразумения, на которые я также указал в посте.Может ли кто-нибудь, пожалуйста, просветить меня?
Путаница № 1
Как указано в документе, якорный ящик назначается фону, если его IoU с любой наземной правдой ниже0,4.В этом случае, какой должна быть соответствующая целевая метка классификации (при условии, что есть K классов)?
Я знаю, что SSD имеет фоновый класс (который составляет K + 1 классов в целом), в то время как YOLO предсказывает доверительный баллуказывает, есть ли объект в поле (не фон) или нет (фон) в дополнение к вероятностям класса К.Хотя в статье я не нашел никаких утверждений, указывающих на то, что RetinaNet включает в себя фоновый класс, я видел это утверждение: «... мы декодируем только предсказания блоков из ... после доверительного уровня детектора порога в 0,05», что, по-видимому,указывают на то, что существует прогноз для оценки достоверности.Однако откуда взялась эта оценка (так как подсистема классификации выводит только K чисел, указывающих вероятность K классов)?
Если RetinaNet определяет метки цели по-другому, чем SSD или YOLO, я бы предположил, что цельвектор длины K со всеми записями 0 с и без 1 с.Тем не менее, в этом случае как фокальная потеря (см. Определение ниже) накажет якорь, если он является ложноотрицательным?
![enter image description here](https://i.stack.imgur.com/Roi7m.png)
где
![enter image description here](https://i.stack.imgur.com/i9hFR.png)
Путаница № 2
В отличие от многих других детекторов, RetinaNet использует независимый от класса ограничитель-регрессор иАктивация последнего уровня подсети классификации - это сигмовидная активация.Означает ли это, что один якорный ящик может одновременно предсказывать несколько объектов разных классов?
Путаница # 3
Обозначим эти совпадающие пары якорного ящика и поля истинности земли.так как $ {(A ^ i, G ^ i)} _ {i = 1, ... N} $, где $ A $ представляет якорь, $ G $ представляет основную истину, а $ N $ является числомсовпадений.
Для каждого совпадающего якоря подсеть регрессии предсказывает четыре числа, которые мы обозначаем как $ P ^ i = (P ^ i_x, P ^ i_y, P ^ i_w, P ^ i_h) $.Первые два числа указывают смещение между центрами якоря $ A ^ i $ и истинностью земли $ G ^ i $, а последние два числа указывают смещение между шириной / высотой якоря и основанием.Соответственно, для каждого из этих прогнозов существует цель регрессии $ T ^ i $, вычисленная как смещение между якорем и истинной земной поверхностью:
![enter image description here](https://i.stack.imgur.com/yRa4a.png)
Являются ли приведенные выше уравнения правильными?
Заранее большое спасибо и не стесняйтесь указывать на любые другие недоразумения в посте!
Обновление:
Для дальнейшего использования, другоепутаница у меня была, когда я изучал RetinaNet (я нашел этот разговор вяло):
![enter image description here](https://i.stack.imgur.com/Imr11.png)