У меня есть следующая проблема, и я не совсем уверен, решается ли она распознаванием изображений (и сверточными нейронными сетями).
У меня есть набор данных из 400 тыс. Изображений, разделенных на 5 классов.Изображения представляют собой скриншоты приложений, которые разбиты на 5 классов в зависимости от того, какой возрастной рейтинг они получили.
Например: у меня есть 200 КБ, помеченных как класс 0, что означает, что они подходят для всех возрастов (согласновозрастной рейтинг);У меня есть 50 тыс. Снимков, помеченных как класс 1 (подходит для детей в возрасте от 6 лет) и т. Д.
С этими данными я хочу обучить нейронную сеть, которая может сказать мне, какой возрастной рейтинг снимок экрана (и, следовательно,соответствующая игра), скорее всего, имеет.
Является ли это проблемой, которая решается распознаванием изображений?
Я рассмотрел примеры (в основном учебные пособия по Keras) для изображенияраспознавание и все они имеют дело с проблемами, которые отчетливо видны (например, «показывает ли изображение кошку или собаку»).Просматривая мой набор данных, я понял, что некоторые изображения довольно похожи, хотя и принадлежат разным классам.
Может ли сверточная нейронная сеть (или любой другой тип алгоритма распознавания изображений) иметь дело с классами, где принятие решенияфактор не виден напрямую?Это просто проблема того, насколько глубока сеть?
Я был бы очень благодарен, если бы кто-то мог указать мне общее направление о том, где искать дополнительную информацию.