Как мы можем поместить ярлык hclust в таблицу в соответствии с кластерами, сформированными на дендограмме - PullRequest
4 голосов
/ 07 апреля 2020

У меня есть дендограмма с кластерами, имеющими много листовых узлов / меток. Как можно поместить эти метки hclust в строку таблицы в соответствии с кластерами, сформированными с помощью R

Ответы [ 2 ]

0 голосов
/ 11 апреля 2020

Я считаю, что более прямой способ сделать это - использовать cutree (а не go через rect.dendrogram):

> d1 <- USArrests[1:10,]
> d1 <- USArrests[1:10,]
> hc <- hclust(dist(d1))
> hcc <- cutree(hc, k = 3)
> hcc
    Alabama      Alaska     Arizona    Arkansas  California 
          1           1           2           1           2 
   Colorado Connecticut    Delaware     Florida     Georgia 
          1           3           1           2           1 
> data.frame(d1, hcc)
            Murder Assault UrbanPop Rape hcc
Alabama       13.2     236       58 21.2   1
Alaska        10.0     263       48 44.5   1
Arizona        8.1     294       80 31.0   2
Arkansas       8.8     190       50 19.5   1
California     9.0     276       91 40.6   2
Colorado       7.9     204       78 38.7   1
Connecticut    3.3     110       77 11.1   3
Delaware       5.9     238       72 15.8   1
Florida       15.4     335       80 31.9   2
Georgia       17.4     211       60 25.8   1

pro tip: если вы используете дендрограмму вместо hclut, вы можете использовать пакет dendextend , чтобы иметь также вырез для дендрограммы.

0 голосов
/ 07 апреля 2020

Вам необходимо получить доступ к данным, хранящимся в вашем rect.hclust объекте, по следующим строкам:

obj <- rect.hclust(my_matrix, k = n)
str(obj)

. Проверяя obj с помощью str, вы найдете список всех переменных, сгруппированных по кластер. Вы можете экспортировать их в табличную форму, например, используя lapply:

labels <- lapply(obj, paste0, collapse = ",")
...