я правильно понимаю кластеризацию? - PullRequest
1 голос
/ 05 ноября 2010

Я случайно получил набор данных с 3 примерами {1,2,3.5}

Я пытался использовать следующие два метода кластеризации:

1. Иерархическая кластеризация с q=2 и Ө =1.1
2. Последовательная кластеризация.

Независимо от того, какой метод кластеризации я выбрал, я всегда придумывал следующие два кластера

{1,2} и {3.5}

Это правильно?
Удивительно, что при использовании двух совершенно разных техник кластеризации результат один и тот же.

Ответы [ 3 ]

3 голосов
/ 05 ноября 2010

Я думаю, что задача поиска двух кластеров из 3-х значений - немного расширить определение того, что такое кластерИспользуйте намного больше точек данных и значительно больше точек данных, чем кластеров.

3 голосов
/ 05 ноября 2010

Я не думаю, что ваше тематическое исследование является достаточно исчерпывающим, чтобы делать осмысленные выводы ..

Возьмите набор данных, достаточно большой, чтобы показать различия, также потому, что последовательная кластеризация фактически создает кластеры, а иерархические сборкидерево.Это не та же история.Затем все зависит от того, как вы выберете порог для разделения иерархического дерева и смещение, используемое для последовательной кластеризации.

1 голос
/ 20 ноября 2010

Чтобы лучше почувствовать кластеризацию, загрузите WEKA и используйте его для кластеризации набора данных iris. WEKA имеет несколько визуализаций, которые дадут вам представление о том, что такое кластеризация. Набор данных радужной оболочки прост с небольшим количеством функций, чтобы вы могли понять результаты.

...