Множество функций с плотным SIFT и SVM - понимание и реализация - PullRequest
0 голосов
/ 27 ноября 2018

Моя цель - обнаружить какой-нибудь подводный объект, в том числе ракетку для бадминтона.У меня есть более 160 изображений этой ракетки, лежащей под водой.Я создал бинарные маски для этого объекта ракетки (объекта, который я хочу обнаружить), а затем рассчитал на основании того, что ракетка маскирует маски подводного пейзажа (камни, листья и т. Д., Объекты, которые я не хочу обнаруживать).Теперь я хочу использовать BOF с плотным просеиванием.Что я намерен сделать:

  1. Создать визуальный словарь - вычислить плотный SIFT на изображении с применением маски ракетки, а затем маски фона (для каждого изображения я вычисляю SIFT два раза - для объектов, которые я хочуобнаружить (ракетка) и для всех других подводных объектов
  2. Имея словарь, мне нужно рассчитать данные поезда SVM - так что еще раз для каждого изображения я вычисляю SIFT, применяя маску своего объекта (и обозначая ее 1) и применяя маску фона(метка 0) - я вычисляю частоту (гистограмму) визуальных слов из словаря.
  3. Распознавание объектов - эта часть сложная для меня. Мой обученный svm знает частоты словарных визуальных слов для ракетки (метка1) и фон (метка 0). Теперь у меня есть изображение, которое я хочу проверить на своем SVM - ракетка лежит под водой среди камней и прочего. Когда я помещаю эти данные в мой SVM, он обнаружит «обе частоты визуальных слов»."- потому что на изображении моя ракетка, а также есть фон. Он обнаруживаетдругие вещи.Теперь, как я могу предотвратить это?Моя идея состоит в том, чтобы сегментировать изображение, которое я хочу классифицировать по нескольким (10-50) регионам, а затем по каждому региону рассчитать плотное SIFT, а затем прогноз SVM на основе плотного просеивания по этим регионам?

Я прав, или я что-то неправильно понял об этом методе BOF.Если я ошибаюсь, как я могу достичь своей цели.Еще раз в моем распоряжении, у меня есть 160 комплектов изображений (оригинальная рамка, маска на ракетке, маска на заднем плане).

...