Как я могу узнать, сколько образцов с потерей> медиана потери; и сколько с потерей, используя иерархическую кластеризацию в R. Я использую набор данных Серьезность заявки Allstate, я думаю, что атрибуты Numberri c нормализованы, они имеют значения от 0 до 1
Это мой код:
claims<-read.csv("train.csv")
idx<-sample(1:dim(claims)[1],10000) #10000 random samples
claimsSample<-claims[idx,118:131] #retrieve the numeric features
distances<-dist(claimsSample,method="euclidean")
clusterClaims<-hclust(distances, method = "ward.D")
plot(clusterClaims)
clusterGroups<- cutree(clusterClaims,k=9)
Итак, как мне найти медиану и образцы ???