У меня есть простой 2-мерный набор данных, который я хочу агломерировать (не зная оптимального количества кластеров для использования). Единственный способ, которым я смог успешно кластеризовать свои данные, это присвоить функции значение 'maxclust'.
Для простоты, скажем, это мой набор данных:
X=[ 1,1;
1,2;
2,2;
2,1;
5,4;
5,5;
6,5;
6,4 ];
Естественно, я бы хотел, чтобы эти данные образовали 2 кластера. Я понимаю, что если бы я знал это, я мог бы просто сказать:
T = clusterdata(X,'maxclust',2);
и найти точки, попадающие в каждую группу, я могу сказать:
cluster_1 = X(T==1, :);
и
cluster_2 = X(T==2, :);
но не зная, что 2 кластера будут оптимальными для этого набора данных, как мне кластеризовать эти данные?
Спасибо