Может ли Распознавание изображений иметь дело с классами, где качество решения непосредственно не видно? - PullRequest
0 голосов
/ 25 февраля 2019

У меня есть следующая проблема, и я не совсем уверен, решается ли она распознаванием изображений (и сверточными нейронными сетями).

У меня есть набор данных из 400 тыс. Изображений, разделенных на 5 классов.Изображения представляют собой скриншоты приложений, которые разбиты на 5 классов в зависимости от того, какой возрастной рейтинг они получили.

Например: у меня есть 200 КБ, помеченных как класс 0, что означает, что они подходят для всех возрастов (согласновозрастной рейтинг);У меня есть 50 тыс. Снимков, помеченных как класс 1 (подходит для детей в возрасте от 6 лет) и т. Д.

С этими данными я хочу обучить нейронную сеть, которая может сказать мне, какой возрастной рейтинг снимок экрана (и, следовательно,соответствующая игра), скорее всего, имеет.

Является ли это проблемой, которая решается распознаванием изображений?

Я рассмотрел примеры (в основном учебные пособия по Keras) для изображенияраспознавание и все они имеют дело с проблемами, которые отчетливо видны (например, «показывает ли изображение кошку или собаку»).Просматривая мой набор данных, я понял, что некоторые изображения довольно похожи, хотя и принадлежат разным классам.

Может ли сверточная нейронная сеть (или любой другой тип алгоритма распознавания изображений) иметь дело с классами, где принятие решенияфактор не виден напрямую?Это просто проблема того, насколько глубока сеть?

Я был бы очень благодарен, если бы кто-то мог указать мне общее направление о том, где искать дополнительную информацию.

Ответы [ 2 ]

0 голосов
/ 25 февраля 2019

Да, в принципе это управляемо .Выходной слой, который вы ищете, называется softmax .Он оценивает вероятность каждого из ваших классов и выбирает тот, который наиболее вероятен.

С "не видимым непосредственно", я полагаю, вы имеете в виду "неочевидным для эксперта-человека".Что ж, это именно то, где начинается машинное обучение. Алгоритмы значительно продвинулись в классификации изображений за последние годы.Однако успех не гарантирован.Должна быть некоторая реальная корреляция между вашими переменными, которую может обнаружить NN.

Как указывал @mshlis: контекст вместе с вашими изображениями может улучшить ваши результаты (например, студия разработчика, размервсе приложение, размер графических данных или что-то еще может быть показателем для прогнозирования возрастной категории)

0 голосов
/ 25 февраля 2019

Могло и не могло.Для CNN, чтобы обеспечить хорошие результаты без контекстного ввода, это означало бы, что должны быть некоторые для корреляции между входом и выходом.Допустим, некоторые приложения имеют дизайн, который коррелирует с возрастным рейтингом, тогда да, это возможно, в противном случае это не так, если вы не дадите сети что-то большее для работы.

Это может фактически подготовить вас к крутому экспериментупроверьте себя, запустите это через какой-нибудь заурядный CNN, и если он оценивает хорошо (через перекрестную проверку), то вы, вероятно, показали, что корреляция существует

(Примечание: если модель не тестирует хорошо, это не доказательство того, что корреляции нет, вероятно, вероятно, но не гарантируется)

...