Разъяснение в R-CNN - PullRequest
       3

Разъяснение в R-CNN

1 голос
/ 11 апреля 2020

Я изучаю обнаружение объектов с использованием R-CNN ...

У меня есть изображения и файл аннотации, который дает ограничивающую рамку для объекта

Я понимаю эти шаги в R- CNN,

Использование выборочного поиска для получения предложенных областей

Сделать все регионы одинакового размера

Подать эти изображения в CNN

Сохранить карты объектов и подача в SVM для классификации


В процессе обучения я взял все объекты (только объекты из изображений, а не фон) и передал в CNN, а затем обучил карты объектов в SVM для классификации.

В каждом блоге, все говорят в R-CNN, есть три части: 1-й выборочный поиск 2-CNN 3-й ящик-регрессия

Но я не получаю глубокого объяснения Регрессия BBox.

Я понимаю, что IOU (Intercept over Union) проверяет точность BBox.

Не могли бы вы помочь мне узнать, как эта регрессия BBox используется для получения координат объекта .

1 Ответ

0 голосов
/ 10 мая 2020

Чтобы объяснить, как работает регрессия BBox, как указано ниже.

Как вы упомянули, это происходит в несколько этапов.

  1. Выборочный поиск:

    1. Генерация начальной подсегментации, мы генерируем много кандидатов или области регионов.
    2. Используйте жадный алгоритм для рекурсивного объединения похожих областей в более крупные.
    3. Используйте сгенерированные области для получения окончательных предложений областей кандидатов.
  2. Регрессия CNN и BBox:

    Регрессором является CNN с сверточными слоями и полностью связанными слоями, но в последнем полностью связанном слое это делает не применяется сигмоид или софтмакс, который обычно используется при классификации, так как значения соответствуют вероятностям. Вместо этого, то, что этот CNN выводит, является четырьмя значениями (?, ?, ℎ, ?), где (?, ?) задают значения положения левого угла и (ℎ, ?) высоту и ширину окна. Чтобы обучить этот NN, функция потерь будет штрафоваться, когда выходные данные NN сильно отличаются от обозначенных (?, ?, ℎ, ?) в обучающем наборе.

...