Один метод, который я считаю распространенным, - это использование модели смеси . Возьмите несколько фоновых кадров и для каждого пикселя создайте модель смешения для своего цвета.
Когда вы применяете рамку с человеком в нем, вы получите некоторую вероятность того, что цвет является передним или задним, учитывая плотности вероятностей в модели смеси для каждого пикселя.
После того, как у вас есть P (пиксель - передний план) и P (пиксель - фон), вы можете просто ограничить вероятностные изображения.
Другая возможность состоит в том, чтобы использовать вероятности в качестве входных данных в некотором более умном алгоритме сегментации. Один из примеров - срез графика , который, как я заметил, работает довольно хорошо.
Однако, если человек носит одежду, визуально неотличимую от фона, очевидно, что ни один из методов, описанных выше, не сработает. Вам нужно будет либо получить другой датчик (например, ИК или УФ), либо иметь довольно сложную «модель человека», которая могла бы «сложить» ноги в правильном положении, если он обнаружит то, что считает туловищем и головой.
Удачи в проекте!