Как правило, нейронные сети могут определять цвет.
Но часто они учатся не делать этого. Из-за различий в цветовой температуре и перспективе разные цвета могут давать одинаковые или похожие значения на уровне пикселей. Поэтому при обучении в больших сетях наборов данных, как правило, они становятся очень независимыми от цвета. К сожалению, я могу говорить только из интуиции и не могу привести ни одного примера или ссылки, но рисунок выше должен дать вам понять, почему.
В вашем случае проблемы еще более осложняются тем, что существует конкурирующая задача по обнаружению ящика с предметом. Благодаря этому во время переподготовки сеть обнаружения может стать нечувствительной к слабым признакам, таким как цвет.
Чтобы разобраться в ситуации, я бы порекомендовал присмотреться к точности вашей классификации во время переподготовки. Насколько я могу судить, учебный код предоставляет только значение потерь. Следует ожидать, что во время переподготовки, по крайней мере, состав поезда должен быть почти идеально одет, то есть зеленый и красный мелки должны стать различимыми. Если нет, то имеет смысл тренироваться дольше или снижать скорость обучения.