иерархическая кластеризация в R - PullRequest
0 голосов
/ 22 апреля 2020
NumVars <- 6:ncol(rate_data) # Columns containing numeric covariates
UASummaries <- aggregate(rate_data[,NumVars],by=list(rate_data$UA), FUN=mean)
rownames(UASummaries) <- UASummaries[,1]
UASummaries <- scale(UASummaries[,-1]) # Standardise to mean 0 & SD 1
Distances <- dist(UASummaries) # Pairwise distances
ClusTree <- hclust(Distances, method="complete") # Do the clustering
plot(ClusTree, xlab="Unitary Authority", ylab="Separation")
abline(h=8, col="red", lty=2)
NewGroups <- paste("UAGrp", cutree(ClusTree,h=8),sep="")
table(rate_data$Region[match(rownames(UASummaries), rate_data$UA)], NewGroups)

enter image description here

Я провел иерархическую кластеризацию для некоторых данных по ожирению. Я планировал использовать новые группы (UAGrp1, UAGrp2, ...) в линейной модели, которую я строю, вместо ковариантного региона. Я не знаю, как создать еще один ковариат, NewGroups, в моем фрейме данных на основе кластеризации.

...