Какой тип дескриптора я должен использовать для обнаружения детенышей тюленей? - PullRequest
14 голосов
/ 18 апреля 2011

У меня есть проект по обнаружению и подсчету детенышей тюленей (животных) на аэрофотоснимке, взятом с пляжа.Новички тюленя черные и маленькие по сравнению со взрослыми тюленями коричневого и большого размера

Некоторые детеныши тюленей перекрываются / частично закрываются.Цвет пляжа почти желтый, но есть некоторые черные камни, которые увеличивают сложность обнаружения.

Какой дескриптор наиболее подходит для моего проекта?HOG, SIFT, Haar-подобные функции?

Я прошу теоретическую часть этой проблемы.Я думаю, что для реализации моего проекта первым шагом должен быть выбор правильного дескриптора, который может наиболее точно представлять объект, затем (объединить несколько слабых функций, не обязательно?) Обучить классификатор, используя метод машинного обучения, такой как повышение / SVM / neural_network, я прав??

Образец изображения: enter image description here

Ответы [ 3 ]

2 голосов
/ 25 апреля 2011

Я не уверен, что согласен, что выбор правильного дескриптора - правильное место для начала. Основная проблема заключается в том, что все объекты похожи по форме. Существуют также существенные градиенты внутри каждого животного. Сложность поз - это еще одна проблема. Я бы разбил проблему на два более простых шага: 1. Уникальное обнаружение объекта (обнаружение края, водораздел, вырезание графика и т. Д.). Что-то вроде проблемы «подсчета клеток крови». 2. Классификация объектов по цвету и площади (нормализуется с точки зрения камеры). Вычислите дробное количество пикселей «желтого цвета» и пикселей «черного цвета» в каждом объекте и используйте эти значения вместе с размером объекта в качестве входных данных для классификатора объекта (нейронные сети - это забавное решение!).

Это довольно загроможденная сцена, поэтому я ожидаю, что оба эти алгоритма потребуют некоторой тонкой настройки. Если ваши требования допускают некоторый уровень взаимодействия с аналитиком, предоставьте несколько ползунков, чтобы аналитик мог регулировать каждый из порогов в ваших алгоритмах.

2 голосов
/ 04 июня 2011

Точность в алгоритмах компьютерного зрения, по-видимому, во многом зависит от возможности их точной настройки на конкретную проблему. Если вы можете делать предположения относительно изображений, которые вы передаете по вашему алгоритму, например, тот факт, что все они являются аэрофотоснимками тюленей на похожей сцене пляжа, то вы можете воспользоваться этим. Я бы сказал, прежде чем пытаться слишком увлекаться локальными функциями, вы можете попробовать что-то вроде сегментации водораздела и подсчитать количество не фоновых сегментов. Watershed предоставляет удобную структуру, называемую «маркерами», для включения предшествующих знаний о ваших входных данных, чтобы различать сегменты «фон» и «передний план».

Такой подход может быть проще и, возможно, более точным, чем локальные функции. По моему опыту, я не смог извлечь и сопоставить множество значимых функций из органического объекта (например, лица или животных) с использованием функций SIFT и SURF. Для меня они, как правило, лучше работают на изображениях комнат или зданий с большим количеством углов.

0 голосов
/ 18 апреля 2011

Не совсем уверен, вы можете попытаться взглянуть на алгоритм хищника, так как вы можете научить его, как легко выглядит тюлень. YouTube видео, описание и ссылка здесь

...