У меня есть одна проблема на втором этапе, которая заключается в накоплении взвешенных голосов за градиентную ориентацию по пространственным ячейкам.
Предполагается, что ячейка 8*8
. Позвольте мне использовать две матрицы GO[8][8]([1 9])
, GM[8][8]
для представления ориентации градиента и величины градиента соответственно.
Ориентация градиента колеблется от 0 - 180
, и есть 9
корзины ориентации.
Согласно моему пониманию HOG, для каждого пикселя в ячейке добавляется его величина градиента к соответствующему баку ориентации. Таким образом, мы можем получить гистограмму для каждой ячейки.
Но есть одно предложение, которое меня смущает.
" Чтобы уменьшить наложение, голоса (величина градиента) интерполируются
трилинейно между соседними центрами бина в обеих ориентациях
и положение." 1
Почему интерполируется? Как интерполировать? Может кто-нибудь объяснит более подробно? Без уменьшения псевдонимов.
Заранее спасибо.
1 Это предложение содержится в докторской диссертации Навниет Далал, стр. 38, строка 4.