Гистограмма ориентированных градиентов в мультимасштабе (среднее смещение?) - PullRequest
5 голосов
/ 05 мая 2011

Я работаю над дескрипторами HOG, и я почти закончил работу с большинством частей, за исключением объединения окон обнаружения.

То, что я до сих пор делал, это;Я строю масштабную пирамиду изображения и для каждого изображения в каждом масштабе я перемещаю окно обнаружения (64x128) и обнаруживаю людей.На каждом изображении человек обнаруживается более чем в одном окне.

Таким образом, вопрос заключается в том, как объединить все эти окна (предположим, для одного человека) в одно окно.Далал предлагает использовать надежный алгоритм обнаружения модов, такой как среднее смещение.Но у меня есть несколько шкал ... Должен ли я сначала оценить истинное местоположение окна обнаружения, найденного на нижних уровнях пространства шкалы, чтобы сделать это?

Любая помощь приветствуется.Заранее спасибо.

1 Ответ

1 голос
/ 13 мая 2011

Моя интерпретация заключается в том, что средний сдвиг даст вам в действительности то, что вы предлагаете.

По сути, вы сначала оцениваете распределение вероятностей местоположения человека по самой крупной шкале, основываясь на сильных сторонах выходов детектора. Это дает вам надежную оценку режима.

Затем вы можете итеративно уточнить, используя более тонкие шкалы вокруг максимума или режима.

Идея очень похожа на то, что используется, например, в пирамидальном слежении за ЛК. Вы также можете выполнять ансамблевую обработку и / или фильтры частиц.

...