Как построить кластеры в графике рассеяния в SAS? - PullRequest
0 голосов
/ 27 сентября 2018

Я создал набор данных с именем clusteringds, используя следующий код:

DATA clusterds;
INPUT ID$ title$ name$ age$ marital_status$ salary% postcode$ ethnic_origin$;
CARDS;
{Inserts Data Here}
run;

Затем я кластеризовал строки на основе идентификатора, используя приведенный ниже код;

proc fastclus data = clusteringds maxc=5 maxiter=10 out=clus;
run;

Это помоглосоздайте таблицу данных с именем Clus, которая представляет собой комбинацию таблицы clusteringds и другой переменной, называемой кластерами, где каждая строка представляет собой номер кластера от 1 до 5.

Я бы хотел изобразить кластеры с помощью графика.Я считаю, что код для этого состоит из;

proc &gplot data = clusteringds;
scatter;
run; 
quit;

Но я не уверен, как закончить создание своего сюжета.Может кто-нибудь помочь, пожалуйста?

1 Ответ

0 голосов
/ 28 сентября 2018

Диаграмма рассеивания может отображать два или три (пузырь) или 4 (пузырь + цвет), но затем она становится довольно занятой.

Давайте начнем с простого, с одного точечного графика

proc sgplot data=clus; *note you need to use the output data set here;
   scatter x= marital_status y=salary / group = cluster; *you may need to verify the cluster name;
   run; quit;
...