Я изучаю обнаружение объектов с использованием R-CNN ...
У меня есть изображения и файл аннотации, который дает ограничивающую рамку для объекта
Я понимаю эти шаги в R- CNN,
Использование выборочного поиска для получения предложенных областей
Сделать все регионы одинакового размера
Подать эти изображения в CNN
Сохранить карты объектов и подача в SVM для классификации
В процессе обучения я взял все объекты (только объекты из изображений, а не фон) и передал в CNN, а затем обучил карты объектов в SVM для классификации.
В каждом блоге, все говорят в R-CNN, есть три части: 1-й выборочный поиск 2-CNN 3-й ящик-регрессия
Но я не получаю глубокого объяснения Регрессия BBox.
Я понимаю, что IOU (Intercept over Union) проверяет точность BBox.
Не могли бы вы помочь мне узнать, как эта регрессия BBox используется для получения координат объекта .