Вычислительные функции HOG - PullRequest
       11

Вычислительные функции HOG

7 голосов
/ 19 августа 2010

У меня есть одна проблема на втором этапе, которая заключается в накоплении взвешенных голосов за градиентную ориентацию по пространственным ячейкам.

Предполагается, что ячейка 8*8. Позвольте мне использовать две матрицы GO[8][8]([1 9]), GM[8][8] для представления ориентации градиента и величины градиента соответственно. Ориентация градиента колеблется от 0 - 180, и есть 9 корзины ориентации.

Согласно моему пониманию HOG, для каждого пикселя в ячейке добавляется его величина градиента к соответствующему баку ориентации. Таким образом, мы можем получить гистограмму для каждой ячейки.

Но есть одно предложение, которое меня смущает.

" Чтобы уменьшить наложение, голоса (величина градиента) интерполируются трилинейно между соседними центрами бина в обеих ориентациях и положение." 1

Почему интерполируется? Как интерполировать? Может кто-нибудь объяснит более подробно? Без уменьшения псевдонимов.

Заранее спасибо.


1 Это предложение содержится в докторской диссертации Навниет Далал, стр. 38, строка 4.

1 Ответ

8 голосов
/ 19 августа 2010

Интерполяция является стандартной техникой для вычисления гистограмм. Идея здесь заключается в том, что каждое значение не просто помещается в одну ячейку, а распределяется между двумя соседними ячейками (с учетом 1-й гистограммы) в зависимости от того, насколько далеко оно находится от центра исходного ячейки.

Цель этого - справиться с ситуациями, когда небольшая ошибка в ваших измерениях может привести к тому, что значение будет помещено в другой контейнер. Это очень хорошая вещь для любого типа гистограммы, не только для HOG, при условии, что у вас есть циклы процессора.

Существует также билинейная и трилинейная интерполяция для 2-й и 3-й гистограмм, где каждое значение распределяется между 4 и 8 соседними бинами соответственно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...