Уважаемые,
При кластеризации выбор функции расстояния, я думаю, зависит от типа данных. А что, если у нас есть смешанные типы данных типа ( непрерывный ) и категориальная (номинальная и / или порядковая) шкала и двоичная номинальная переменная ? Существует ли какая-либо направляющая линия для определенного типа функции c расстояния в этом случае? Если нет, то я хотел бы узнать, какой выбор подходит для двоичной именной переменной?
Спасибо, Шошо