У меня есть набор данных, который содержит данные продолжений и категорий. Для категориальных данных у меня есть 5 факторов с 1-5 значениями, которые на самом деле имеют некоторый порядок (порядковые данные).
Могу ли я использовать кластеризацию k-средних и евклидово расстояние для кластеризации или мне следует использовать расстояние Гауэра?
Должен ли я преобразовать мои данные в стандартные нормализованные значения?
Когда использовать евклидово расстояние и расстояние Гауэра?
Как мы можем знать, что мы сформировали правильные кластеры?