Нужен API для автоматической пометки изображений, есть предложения? - PullRequest
6 голосов
/ 16 ноября 2010

Я создаю приложение, которое должно взять изображение и вывести теги, связанные с ним. Эти теги могут относиться к вещам, прилагательным или даже эмоциям, связанным с картинкой.

Я уже нашел ALIPR . Но я проверил это, некоторые другие люди также проверили это , и оно не работает хорошо ALIPR допускает слишком много ошибок в наборе из 15 предсказанных тегов. По крайней мере, для моего приложения лучше иметь несколько, но правильных тегов.

Предпочтительно, API должен быть веб-интерфейсом и бесплатным. Есть предложения?

Заранее спасибо!

Ответы [ 5 ]

4 голосов
/ 16 ноября 2010

Я думаю, что если бы изображения могли быть помечены автоматически, Google давно бы отказался от ярлыка для изображения .К сожалению, у компьютеров много проблем с пониманием изображений.

Редактировать:

  • Если вы заинтересованы в исследованиях компьютерного зрения, посмотрите на CVPapers , особенно Реализация с открытым исходным кодом для компьютерного зрения .Автоматическая маркировка изображений далеко не решена (если у вас нет очень определенного / ограниченного набора тем).

  • Цитата из Руководство Google с Вторник13 марта 2007 г. :

    Слова «Ларри Пейдж» и «Сергей Брин» появляются рядом с изображениями Эрика Шмидта, или в подписях к изображениям, или в ссылках на эти изображения.Google делает предположение, что слова связаны с изображением.Технология Google еще не дошла до того, что она может сказать, что на изображении, посмотрев прямо на него.

HTH, не надейтесь слишком высоко.

PS: Надеюсь, вы (или кто-то еще) докажете, что я не прав, и поделитесь здесь со мной; -)

Edit2:

Я простонаткнулся на Voc 2010 Challenge , который, на мой взгляд, очень хорошо иллюстрирует текущее состояние развития компьютерного зрения.В одном из заданий участники должны найти объект (из очень ограниченного набора объектов) на изображении и классифицировать его.На странице результатов вы можете видеть, что одному из алгоритмов удается классифицировать воздушный самолет с точностью до 93%, но «не удается» в других категориях.

Это только для квестачтобы найти «вещи», даже не прилагательные или эмоции.

3 голосов
/ 05 октября 2016

Не совсем ясно, хотите ли вы определить теги , чтобы использовать себя, или просто позволить программному обеспечению использовать "здравый смысл" универсальный набор тегов о показанных объектахи т.д.

Допустим, вы хотите определить свой собственный набор тегов - они могут относиться к сезону года , в котором была сделана фотография, настроению связанный с изображением (на основе цветовой схемы и изображенных объектов и т. Д.), Или что-то техническое , которое необходимо различать (нагота, детализация, тип фона и т. Д.).

Мыдля этого можно использовать машинное обучение !Это отрасль искусственного интеллекта, которая изучает правила (например, как помечать изображения - даже очень сложные правила), когда мы приводим множество примеров изображений.Поэтому основной шаг для вас - собрать набор примеров изображений для каждого тега, который вы хотите. После того, как вы сделаете это, для изображений у вас есть две основные опции:

  • Используйте среду глубокого обучения , которая позволяет применять нейронные сети к проблеме.Вам нужно будет разделить ваши данные на более мелкие части, сделать немного кодирования, и, если у вас нет много изображений, используйте различные приемы, чтобы они хорошо изучили вашу задачу.Если вы не заинтересованы в исследованиях, caffe и TensorFlow - это те, на которые стоит обратить внимание (год назад рекомендация была другой, а год спустя она может снова отличаться).

  • Используйте онлайн API , как вы упомянули.Но для задачи, в которой вы хотите свой собственный набор задач, у вас не так много вариантов, так как большинство служб просто делают общую классификацию - они сортируют ваши изображения в зависимости от того, на каких объектах "повседневной жизни" они обнаруживаютизображения (а иногда и особые случаи, такие как NSFW, но часто не на желаемом уровне чувствительности).

Опция, которую вы можете выбрать среди веб-интерфейсов API, - vize.it , который предлагает веб-интерфейс, в который вы можете загружать и маркировать свои примеры изображений, и позволяет обучать свой собственный API AI, который генерирует указанные вами теги .Таким образом, вы получаете лучшее из обоих миров.К сожалению, это не совсем бесплатно, но план довольно дешевый для небольшого количества изображений, и вы получаете бесплатный образец в начале (плюс процесс обучения тоже бесплатный).

Отказ от ответственности: Яодин из соавторов vize.it.

3 голосов
/ 03 декабря 2014

Выезд https://imagga.com/ У него впечатляющие результаты. Также некоторые очень интересные результаты ... К счастью, все сгенерированные теги имеют значение достоверности, так что вы всегда можете игнорировать что-либо меньшее, чем пороговое значение (~ 15% для моего варианта использования). 12 000 изображений в месяц бесплатно, неплохо. Если у вас более 12 000 изображений в месяц, просто поставьте свои запросы в очередь.

1 голос
/ 06 апреля 2016

попробуй кларифай апи лучший апи, с которым я сталкивался. Кроме того, они предлагают 5000 тегов изображений в месяц бесплатно, чтобы вы могли проверить это. они предлагают несколько начальных проектов для Android, IOS, Javascript, Python и т. д.

Есть много других, таких как imagga, alchemyapi, clevapi и т. Д. Используйте Google, чтобы найти больше

если вам нужна дополнительная помощь, вы можете написать мне.

0 голосов
/ 26 октября 2018

Автоматизация тегов изображений все еще находится в стадии разработки. Я думаю, что многие люди работают над этим, но самый простой способ добиться этого - это работать с некоторыми службами, такими как https://linkedai.co,, эти решения не так дороги исэкономит вам много времени.

...