Кластеризация по смешанному типу данных с использованием R - PullRequest
0 голосов
/ 09 июля 2019

У меня есть набор данных, который содержит данные продолжений и категорий. Для категориальных данных у меня есть 5 факторов с 1-5 значениями, которые на самом деле имеют некоторый порядок (порядковые данные).

  • Могу ли я использовать кластеризацию k-средних и евклидово расстояние для кластеризации или мне следует использовать расстояние Гауэра?

  • Должен ли я преобразовать мои данные в стандартные нормализованные значения?

  • Когда использовать евклидово расстояние и расстояние Гауэра?

  • Как мы можем знать, что мы сформировали правильные кластеры?

...