Моя гипотетическая задача под рукой состоит в том, чтобы уметь по одной сверху изображать геометрически неискаженную банку с напитком, дать ее классификацию (например, бренд и название напитка).Сегментация не требуется.Входные данные для функции классификации - это просто вид, ОДИН вид, банки с любой из ее сторон.Набор данных должен быть большим, около 2000 различных видов напитков.Все банки имеют одинаковый размер.Для тренировки каждую банку поворачивают несколько сотен раз, чтобы включить практически любой угол.
Есть идеи, как лучше всего подойти к этому?Мне кажется, что это проблема распознавания текстур, когда форма самого объекта не имеет значения.Классификация также должна быть быстрой, поэтому сопоставление с шаблоном исключается.Если бы кто-то мог указать мне правильное направление, это был бы огромный шаг вперед.Нет идей, которые я придумаю, кажется действительно подходящим для этой задачи.Местные особенности (SIFT / SURF) и т. Д.?Слишком генерал.Бренд может иметь одинаковый логотип на разных напитках, которые они производят.Нейронные сети?С разных сторон банка может выглядеть очень по-разному, что может испортить тренировку, если все они будут отображаться на одной этикетке.Мешок слов?HOGs / цветные гистограммы и т. Д. Для обучения SVM?Что-то совершенно другое, чего я не знаю, о чем я, возможно, не знаю?