Объяснение дескрипторов функций в компьютерном зрении и машинном обучении - PullRequest
1 голос
/ 10 января 2020

Я немного начал работать с методами компьютерного зрения, в основном с глубоким обучением, но я хочу попытаться получить хорошее представление о более традиционных методах, а также для хорошего заземления. Я играл с некоторыми ручными методами разработки функций для классификации с помощью классификаторов RF и SVM. Я рассмотрел представления текстур, такие как дескрипторы HOG и LBP, а также краевые фильтры, фильтры Габора и пространственные функции, такие как дескрипторы Фурье. Чего мне не хватает, так это хорошего представления о том, как группируются различные функции и к каким категориям они относятся. Я знаю, что некоторые из них определены как глобальные и локальные, но что это означает и какие именно? и есть ли другие категории, такие как текстура и геометрия c, которые я должен рассмотреть? Любое объяснение было бы полезно и высоко ценится (я много смотрел в Интернете, но все кажется немного фрагментированным)

Спасибо!

1 Ответ

2 голосов
/ 11 января 2020

Особенности - это информация, извлеченная из изображений в виде числовых значений, которые трудно понять и сопоставить человеку. Предположим, мы рассматриваем изображение как данные, а информация, извлеченная из данных, называется особенностями. Как правило, объекты, извлеченные из изображения, имеют гораздо меньший размер, чем исходное изображение. Уменьшение размерности уменьшает накладные расходы на обработку пакета изображений.

По существу, из изображений на основе приложения извлекаются два типа функций. Это локальные и глобальные особенности. Функции иногда называют дескрипторами. Глобальные дескрипторы обычно используются для поиска изображений, обнаружения и классификации объектов, в то время как локальные дескрипторы используются для распознавания / идентификации объектов. Существует большая разница между обнаружением и идентификацией. Обнаружение - это обнаружение существования чего-либо / объекта (определение того, существует ли объект в изображении / видео), при котором распознавание находит идентичность (распознавание человека / объекта) объекта.

Глобальные характеристики описывают изображение в целом, чтобы обобщить весь объект, где в качестве локальных особенностей описывают пятна изображения (ключевые точки на изображении) объекта. Глобальные функции включают в себя представления контуров, дескрипторы форм и объекты текстуры, а локальные элементы представляют текстуру в патче изображения. Матрицы формы, инвариантные моменты (Ху, Церинке), гистограммно-ориентированные градиенты (HOG) и Co-HOG являются некоторыми примерами глобальных дескрипторов. SIFT, SURF, LBP, BRISK, MSER и FREAK - некоторые примеры локальных дескрипторов.

Как правило, для приложений низкого уровня, таких как обнаружение и классификация объектов, используются глобальные функции и для приложений более высокого уровня, таких как распознавание объектов , местные особенности используются. Комбинация глобальных и локальных функций повышает точность распознавания с побочным эффектом вычислительных затрат.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...