Я работаю над проектом в MATLAB (с последующей реализацией на C ++ или, возможно, на Python, с OpenCV), где при запуске видео в реальном времени пользователь может нарисовать область интереса.Он будет вытянут как многоугольник.Тем не менее, этот ROI может выйти из кадра, а затем снова появиться.На этом этапе его следует распознать и обнаружить.Основная проблема заключается в том, что это не характерный объект с определенными физическими характеристиками, поскольку он может изменять (до некоторой степени) форму, изгиб, растяжение.Кроме того, предполагается, что он запускается в режиме реального времени, что затрудняет проведение обучения.
Я пытался использовать цветовые гистограммы, чтобы подчеркнуть цветовые особенности области интереса, а затем портировать изображение, но оно работает тольков конкретных условиях.У меня есть инженерное образование, но я не использовал машинное обучение до этого.Я читал, что функции HOG с SVM могут помочь, или даже преобразование Хафа.Я получил некоторые хорошие результаты, используя ACF, но для классификатора он все еще требует фазы обучения.
Целью этого является повторная инициализация трекеров в этом регионе после того, как они были полностью потеряны.Я знаю, что, пройдя обучение по классификатору, можно будет распознать его с помощью ряда алгоритмов, но проблема в том, что я делаю это в режиме реального времени и без какой-либо предварительной подготовки.
Поскольку видео является хирургическим,Я загрузил 4 примера фрейма того, каким будет ограничивающий прямоугольник области интереса пользователя.
(ниже приведены подробные фотографии операций, наведите курсор мыши на область над областью мыши или щелкните, чтобы показать их.)
Любое предложение будет очень полезно.