В настоящее время я работаю над проблемой классификации фруктов с этим набором данных от Kaggle. Моя идея состоит в том, чтобы классифицировать фрукты с помощью алгоритмов K-NN и K-Means для различных целей, и я использую гистограммы RGB изображений (три гистограммы для каждого изображения: одна для красного, другая для зеленого и другая для синего ) в качестве критерия для классификации. В обоих алгоритмах расстояние между соседями / центроидами соответственно и изображением получается путем вычисления евклидова расстояния между ними.
Я столкнулся со следующей проблемой: фон изображения может играть ключевую роль во время классификации , что приводит к неправильной классификации изображений. Например: в случае изображения банана с красным фоном этот красный цвет может заставить алгоритм классифицировать банан как яблоко.
При этом возникает вопрос: is Есть ли какой-нибудь математический метод обработки изображений, который я мог бы использовать, чтобы отменить или хотя бы значительно уменьшить влияние цвета фона изображения в классификации?
Большое спасибо.