Алгоритмы распознавания объектов с открытым исходным кодом - PullRequest
4 голосов
/ 11 октября 2011

Я много раз искал правильные алгоритмы, которые можно использовать для моей программы распознавания объектов. Но все, что я нашел, имело некоторые серьезные недостатки.

Моя программа должна изучать новые объекты по мере их появления в Интернете. Когда он встречает новый объект, над ним ограничивается прямоугольник, и объект изучается (OpenTLD делает это отлично). Повторите это 1000 раз для разных объектов, программа должна быть способна распознавать классы 1000 экземпляров и экземпляры объектов (это может сделать каскад Haar-подобных функций, OpenTLD терпит неудачу). Алгоритм должен быть масштабно-ориентированным и инвариантным (Хаар терпит неудачу).

Все, что я нашел, могло соответствовать только некоторым из вышеперечисленных критериев, но не соответствовало остальным. Удивительно, но я еще сталкивался с чем-либо, что могло бы соответствовать всем критериям. Я упоминаю только Haar и OpenTLD, поскольку они наиболее близки к тому, что мне нужно. Другие алгоритмы, такие как SIFT, SURF, еще дальше от того, что мне нужно.

Итак, мой вопрос: существует ли какой-либо существующий исходный код, который делает то, что мне нужно? Или мне бы повезло, если бы я изменил существующий исходный код?

1 Ответ

4 голосов
/ 18 марта 2012

TLD и работа Kalal отлично подходят для отслеживания . Однако распознавание - это совсем другая проблема.

Я не понимаю, почему вы отказываетесь от SIFT или SURF за признание. Я бы определенно посмотрел в этом направлении. Гистограммы ориентированных градиентов (HoG) ( Wikipedia ) - это родственное семейство алгоритмов, которое считается современным. Например, он используется в той или иной форме во многих документах ICIP'11.

То, что вы спрашиваете, все еще остается нерешенной проблемой в компьютерном зрении. Вы не найдете много готового кода. Исследовательский код (например, Matlab) для некоммерческого использования, да, но вам, возможно, придется его сильно модифицировать / оптимизировать для реального использования. Некоторые компании, такие как Pongr, Kooaba, IQEngines, предлагают онлайн-API для распознавания объектов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...