Я пытаюсь кластеризовать набор данных, который содержит две переменные:
Одна категориальная переменная, которая имеет 800 различных уровней идентификатора и одна непрерывная переменная, которая измеряет производительность.
Я знаю, что K-means не будет работать из-за категориального.
Должен ли я использовать K-режимы?
Любое предложение может оказать большую помощь.