Кто-нибудь знает хороший алгоритм для выполнения кластеризации по дискретным и непрерывным атрибутам? Я работаю над проблемой идентификации группы похожих клиентов, и у каждого клиента есть как дискретные, так и непрерывные атрибуты (тип клиентов, сумма дохода, полученного этим клиентом, географическое положение и т.
Традиционно алгоритм типа K-средних или EM работает для непрерывных атрибутов, что, если у нас есть смесь непрерывных и дискретных атрибутов?