Влияет ли присутствие определенного объекта на всех изображениях набора данных на производительность CNN - PullRequest
0 голосов
/ 09 мая 2018

Контекст: в моем наборе данных есть частичные изображения размеров разных транспортных средств (Частичные изображения из-за ограниченного поля зрения объектива камеры). Эти частичные изображения покрывают более половины транспортного средства и могут рассматриваться как хорошие репрезентативные изображения транспортного средства. Категории транспортных средств: легковые, автобусные, грузовые. Я всегда получаю колесо транспортного средства на этих изображениях, и поскольку я снимаю эти изображения в разные части дня, интенсивность цвета колес меняется в течение дня. Однако колесо определенно присутствует на всех изображениях.

Вопрос: Я хотел знать, повлияет ли присутствие объекта на всех изображениях набора данных, не логически полезных для классификации, каким-либо образом на CNN. По сути, я хотел знать перед тренировкой CNN, должен ли я замаскировать объект, то есть зачеркнуть его на всех изображениях, или просто оставить его там.

1 Ответ

0 голосов
/ 09 мая 2018

CNN создает иерархическое разложение изображения на комбинации различных дискриминационных паттернов. Эти паттерны изучаются во время обучения, чтобы найти те, которые хорошо разделяют классы.

Если объект присутствует в каждом изображении, вполне вероятно, что он не нужен для разделения классов и не будет изучен. Если есть какой-то вариант в объекте, который зависит от класса, то, возможно, он будет использован. Действительно сложно заранее узнать, какие функции важны. Возможно, у автобусов более блестящие колеса, чем у других автомобилей, и вы этого не заметили, поэтому использование колеса на изображении полезно.

Если вы случайно ввели некоторую вариацию, специфичную для класса, это может вызвать проблемы для дальнейшей классификации. Например, если вы только фотографировали автобусы ночью, сеть может узнать night = bus, а когда вы покажете ей фотографию автобуса днем, она не будет правильно классифицироваться.

Однако использование исключения из сети вынуждает его изучать несколько функций для классификации, а не просто полагаться на них. Так что, если есть различия, это может не иметь такого большого влияния.

Я бы использовал изображения, ничего не скрывая. Если это не что-то простое, такое как фоновое удаление частиц и т. Д., Обнаружение и затемнение объекта добавляет еще один уровень сложности. Вы можете проверить, имеют ли колеса большое значение, обучив сеть на обычных изображениях, затем классифицируя несколько обучающих примеров с затемненным объектом и наблюдая, изменяются ли вероятности класса.

Сосредоточьте свою энергию на хорошем увеличении данных, вот где вы получите наибольшую прибыль.

Вы можете увидеть пример того, какие особенности изучены в MNIST в этой статье .

...