Я пытаюсь запустить кластеризацию только с категориальными переменными.Поскольку Kmeans применяется только для числовых данных, есть ли какие-либо методы кластеризации?
У меня есть 30 переменных, таких как почтовый индекс, возрастная группа, хобби, предпочтительный канал, семейное положение, кредитный риск (низкий, средний, высокий),статус образования и т. д. Если я преобразую каждую из этих переменных в фиктивные и запуском kmeans, у меня будет 90 столбцов (30 * 3 - при условии, что каждая переменная имеет 4 фактора).Это правильно?