У меня есть огромное количество данных с более чем 10 ковариатами. В настоящее время я использую иерархическую кластеризацию. На дендрограмме я не могу четко видеть метки, потому что их так много.
- Есть ли способ узнать, какие наблюдения находятся в какой группе?
(я использую R)
Да, это возможно с cutree:
cutree
## some data set.seed(1234) x <- matrix(rnorm(1000), ncol=10) ## clustering hc <- hclust(dist(x)) plot(hc) ## k = number of groups cutree(hc, k=5) ## or: ## h: height in cluster dendrogram cutree(hc, h=6)