Я хочу выполнить классификационную задачу, в которой я сопоставляю заданное изображение объекта одному из списка предопределенных созвездий, в которых может находиться объект (т. Е. Нахожу наиболее вероятное совпадение).Чтобы получить дескрипторы изображения (на котором я буду запускать алгоритмы машинного обучения), мне было предложено использовать SIFT с реализацией VLFeat.
Прежде всего, мой главный вопрос - я хотел бы игнорировать часть sift для поиска ключевой точки и использовать ее только для своих дескрипторов.В уроке я увидел, что есть возможность сделать это, вызвав
[f,d] = vl_sift(I,'frames',fc) ;
, где fc указывает ключевые моменты.Моя проблема в том, что я хочу явно указать ограничивающую рамку, в которой я хочу вычислить дескрипторы вокруг ключевой точки - но, похоже, я могу указать только параметр масштаба, который сейчас немного загадочен для меня и не позволяетмне указать явно ограничивающий прямоугольник.Есть ли способ достичь этого?
Второй вопрос: имеет ли смысл устанавливать шкалу вручную и получать дескрипторы таким образом?(т.е. привести к хорошему дескриптору?).Любые другие предложения относительно лучших способов получения дескрипторов?(используя SIFT с другими реализациями или другими не-SIFT дескрипторами).Я должен упомянуть, что мой объект всегда является единственным объектом на изображении, центрирован, имеет постоянное освещение и изменяется при некоторых видах поворотов его внутренних частей - и именно поэтому я подумал, что SIFT сработает так, как я понял, на нем основное внимание уделяетсяградиенты ориентации, которые будут меняться в зависимости от поворота объекта.
Спасибо