Какой метод кластеризации подходит для какого типа данных? - PullRequest
2 голосов
/ 04 июня 2010

Хотелось бы узнать

  1. K-means лучше всего подходит для кластеризации данных какого типа?
  2. Когда k-means не работает? для какого типа данных набор k-средних не дает точного ответа?
  3. COBWEB лучше всего подходит для кластеризации данных какого типа?
  4. Когда не работает COBWEB? для какого типа набора данных COBWEB не дает точного ответа?

Ответы [ 3 ]

1 голос
/ 11 июня 2010

К-средние могут иметь проблемы с большими размерами при использовании евклидова расстояния, поскольку все оказывается «близко».

Какой тип кластеризации вы пытаетесь сделать?

1 голос
/ 25 июня 2010

У меня были проблемы с использованием K означает кластеризацию с набором данных, который включал Dip и Dip Direction (точки на поверхности сферы). В конце концов мне пришлось создать грубый генетический алгоритм для кластеризации.

1 голос
/ 05 июня 2010

1) Глядя на некоторое бесконечное обучение. Конечное обучение, я могу сказать, что К-среднее лучше всего подходит для любого типа данных, которые можно разделить на векторы, и лучше всего для количественных данных.

2) K-means терпит неудачу, когда количество данных не так много, Когда начальное условие чувствительно или мерцает, что дает разные результаты

...