Как кластеризация данных помогает в распознавании изображений или образов - PullRequest
7 голосов
/ 17 сентября 2009

Я играл с различными алгоритмами кластеризации данных, работая над поиском кластеров между случайными точками данных, представляющими собой узлы, я продолжаю читать, что кластеризация данных используется для распознавания изображений. Я не могу установить связь, как кластеризация данных помогает распознавать изображение или распознавать лица. может кто-нибудь объяснить это?

1 Ответ

12 голосов
/ 17 сентября 2009

Неудивительно, что кластеризация используется для распознавания образов в целом и распознавания изображений, в частности: кластеризация процесс сокращения , и изображения в эту мегапиксельную эру нуждаются в сборе ... Это также процесс, который производит категории и это, конечно, полезно.

Однако существует много подходов к использованию кластеризации в качестве метода для распознавания изображений . Одна из причин такого разнообразия заключается в том, что кластеризация может применяться на разных уровнях для разных целей: от базового уровня пикселей до уровня объектов (линия, геометрическая фигура ...), для классификации или для других целей.

На очень высоком уровне кластеризация является статистическим инструментом , который помогает обнаружить относительную важность различных аспектов в определении принадлежности конкретного элемента к определенной категории.

Один [из многих] случаев использования такого инструмента, с контролируемым обучением , посредством чего набор предметов, выбранных человеком (скажем, изображения) подаются в кластерную логику вместе с меткой, связанной с конкретным элементом («это яблоко», «это другое яблоко», «это лимон» ...), тогда логика кластеризации определяет, насколько важно каждое измерение входных данных для помощи каждой группе элементов (яблоки, лимоны ...) в отдельном кластере (например, цвет может иметь относительно небольшое значение, но форма, или наличие точек, или что-то еще может иметь большое значение). После этой фазы обучения новые изображения можно подавать в логику, и, увидев, как близко к конкретному кластеру падает это изображение, оно «распознается» (как банан!).

Когда дело доходит до обработки изображений, нужно помнить, что все, что «подается» в логику кластеризации, не обязательно (фактически, редко) необработанные пиксели, но различные «объекты» характеризующие различные «элементы» исходных данных (по сути, набор векторов относительно высокой размерности, мало чем отличающихся от тех, с которыми можно столкнуться в других других примерах кластеризации данных) и полученных на предыдущих этапах процесса. Например, важным элементом распознавания лиц, вероятно, является точное расстояние между центром глаз. На предыдущих этапах изображение обрабатывается таким образом, чтобы выяснить, где находятся глаза (возможно, полагаясь на другую логику, основанную на кластеризации). Затем расстояние между глазами вместе со многими другими элементами передается в конечную логику кластеризации.

Предыдущее описание является лишь одним примером использования кластеризации для распознавания изображений. Действительно, различные формы нейронных сетей очень успешно использовались в этой области, и можно утверждать, что в некотором смысле эти нейронные сети объединяют информацию. Одна из причин успеха нейронных сетей может заключаться в их способности более уважительно относиться к измерению locality , как указано в исходном вводе, а также к их способности работать в иерархической манере .

Хорошим выводом для этой статьи будет короткий список онлайн-ресурсов, но на данный момент мне не хватает времени ... "продолжение следует"; -)

Редактирование на следующий день : (неудачная попытка представить вступительную онлайн-библиографию по теме)

Мой поиск литературы по теме кластеризации применительно к искусственному зрению и обработке изображений выявил два отдельных ... кластера; -)

  • Книги, такие как Алгоритмы обработки изображений и компьютерного зрения J Parkey pub Wiley, или Machine Vision: теория, алгоритмы, практические действия M Seul et. Аль Кембридж UP. Такие книги обычно охватывают все важные методы, связанные с уменьшением шума, обнаружением краев, преобразованием цвета или интенсивности и многими другими элементами цепочки обработки изображений, большинство из которых не включают кластеризацию или даже статистические методы, и они оставляют за собой только главу или два или даже незначительные упоминания о кластеризации применительно к распознаванию образов или другим задачам.
  • Научные статьи и справочники для конференций, которые конкретно охватывают методы кластеризации, применяемые к искусственному зрению и тому подобное, но в самом узком и глубоком виде (например: Варианты алгоритма Фукунаги и Нарендры, для приложений в распознавании символов, или Быстрые методы для выбора ближайших соседей-кандидатов в любом контексте.)

Короче говоря, я чувствую себя плохо подготовленным, чтобы предложить какую-то конкретную книгу или статью.

Вы можете посчитать информативным просмотр названий в, скажем, книгах Google, ввод с помощью «Искусственное зрение» или «Распознавание изображений» или некоторых или названий, упомянутых выше. Благодаря функции предварительного просмотра, а также облаку тегов (кстати, другому приложению кластеризации), указанному в ссылке «Об этой книге», можно получить представление о содержании различных книг и, возможно, решить приобрести некоторые из них. К сожалению, ограниченный круг читателей и потенциально прибыльные приложения на местах делают эти книги относительно дорогими. На другом конце спектра вы можете скачать, иногда бесплатно, исследовательские работы, в которых обсуждаются сложные темы в этой области. Они также будут отображаться в обычном (веб) Google или в специализированных репозиториях, таких как CiteSeer .

Удачи в ваших исследованиях в этой области!

...