Учитывая N функций SIFT / SURF, извлеченных из 100 обучающих изображений, описывающих конкретный объект, и учитывая функции M SIFT / SURF, извлеченные из нового изображения A, которые могут содержать или не содержать этот объект (а также другие объекты, которые мы нене волнует) как бы вы определили, изображает ли объект А этот объект?
Единственный известный мне метод - это кластеризация обучающих элементов и генерация гистограммы для каждого тренировочного образа, а затем тренировкаклассификатор (например, SVM) на этих гистограммах.Затем вы должны проверить объект на изображении A, извлекая элементы, рассчитать гистограмму и затем классифицировать гистограмму, используя обученный классификатор.
Основная проблема этого подхода заключается в том, что предполагается, что изображение A содержит толькообъект и ничего больше, или он не содержит объект.Другими словами, если бы объект был человеком, и он был обучен на изображениях этого человека, он не смог бы обнаружить этого человека, стоящего в толпе, потому что получающаяся гистограмма была бы загрязнена признаками всех другихлюди в толпе.
Каковы другие методы для достижения этой цели?