CNN создает иерархическое разложение изображения на комбинации различных дискриминационных паттернов. Эти паттерны изучаются во время обучения, чтобы найти те, которые хорошо разделяют классы.
Если объект присутствует в каждом изображении, вполне вероятно, что он не нужен для разделения классов и не будет изучен. Если есть какой-то вариант в объекте, который зависит от класса, то, возможно, он будет использован. Действительно сложно заранее узнать, какие функции важны. Возможно, у автобусов более блестящие колеса, чем у других автомобилей, и вы этого не заметили, поэтому использование колеса на изображении полезно.
Если вы случайно ввели некоторую вариацию, специфичную для класса, это может вызвать проблемы для дальнейшей классификации. Например, если вы только фотографировали автобусы ночью, сеть может узнать night = bus
, а когда вы покажете ей фотографию автобуса днем, она не будет правильно классифицироваться.
Однако использование исключения из сети вынуждает его изучать несколько функций для классификации, а не просто полагаться на них. Так что, если есть различия, это может не иметь такого большого влияния.
Я бы использовал изображения, ничего не скрывая. Если это не что-то простое, такое как фоновое удаление частиц и т. Д., Обнаружение и затемнение объекта добавляет еще один уровень сложности. Вы можете проверить, имеют ли колеса большое значение, обучив сеть на обычных изображениях, затем классифицируя несколько обучающих примеров с затемненным объектом и наблюдая, изменяются ли вероятности класса.
Сосредоточьте свою энергию на хорошем увеличении данных, вот где вы получите наибольшую прибыль.
Вы можете увидеть пример того, какие особенности изучены в MNIST в этой статье .