Как отобразить определенный кластер в R? - PullRequest
0 голосов
/ 29 апреля 2019

У меня есть набор данных, который включает результаты тестов по годам для каждого штата, и я сгруппировал его, используя следующий код:

cluster.m4 <- na.omit(states.data, cols="AVG_MATH_4_SCORE")
d <- dist(cluster.m4$AVG_MATH_4_SCORE)
hp <- hclust(d)
plot(hp, hang = -1, labels=cluster.m4$STATE)
rect.hclust(hp, k=4, border="red")

Вывод, который я получаю, выглядит следующим образом:

Дендрограмма данных

Так, как сейчас, нет простого способа прочесть этикетки.Есть ли способ для меня, чтобы отобразить только один из кластеров, чтобы я мог читать метки?

1 Ответ

2 голосов
/ 29 апреля 2019

Вы можете использовать cutree из статистики, чтобы разбить вашу дендрограмму на несколько частей. Вы можете указать

k: целочисленный скаляр или вектор с требуемым количеством групп

или

h: числовой скаляр или вектор с высотами, где должно быть вырезано дерево.

Исходя из вашего изображения, я думаю, что резка на высоте 15 будет работать:

cutree(hp, h = 15)
...