Выявление запятнанных текстурных пятен из большого набора данных - PullRequest
1 голос
/ 17 августа 2011

Моя гипотетическая задача под рукой состоит в том, чтобы уметь по одной сверху изображать геометрически неискаженную банку с напитком, дать ее классификацию (например, бренд и название напитка).Сегментация не требуется.Входные данные для функции классификации - это просто вид, ОДИН вид, банки с любой из ее сторон.Набор данных должен быть большим, около 2000 различных видов напитков.Все банки имеют одинаковый размер.Для тренировки каждую банку поворачивают несколько сотен раз, чтобы включить практически любой угол.

Есть идеи, как лучше всего подойти к этому?Мне кажется, что это проблема распознавания текстур, когда форма самого объекта не имеет значения.Классификация также должна быть быстрой, поэтому сопоставление с шаблоном исключается.Если бы кто-то мог указать мне правильное направление, это был бы огромный шаг вперед.Нет идей, которые я придумаю, кажется действительно подходящим для этой задачи.Местные особенности (SIFT / SURF) и т. Д.?Слишком генерал.Бренд может иметь одинаковый логотип на разных напитках, которые они производят.Нейронные сети?С разных сторон банка может выглядеть очень по-разному, что может испортить тренировку, если все они будут отображаться на одной этикетке.Мешок слов?HOGs / цветные гистограммы и т. Д. Для обучения SVM?Что-то совершенно другое, чего я не знаю, о чем я, возможно, не знаю?

1 Ответ

0 голосов
/ 19 августа 2011

Один хороший подход - смоделировать форму банки, чтобы вы могли сопоставить текстуру и надписи в банке с плоским прямоугольником.Исходя из этого, вы можете выполнить сопоставление шаблонов с использованием версий низкого разрешения или сопоставления шаблонов на основе гауссовой пирамиды для быстрого сопоставления.

Второй вариант заключается в извлечении ключевых точек SIFT или SURF этого «планаризованного» изображения и попытке найти соответствующиеочки в тренировочном наборе.Хотя одни и те же логотипы или тексты могут отображаться на нескольких разных банках, вы можете использовать расположение ключевых точек, чтобы различать банки.

...