посмотрите на эту страницу :
У меня также есть похожий вопрос здесь
Кажется, мы можем использовать копенетическую корреляцию, чтобы измерить сходство между двумя дендрограммами. Но, похоже, в настоящее время в R нет функции для этой цели.
РЕДАКТИРОВАТЬ в 2014,9,18:
Функция cophenetic
в пакете stats
способна вычислять матрицу кофенетических различий. и корреляция может быть рассчитана с использованием функции cor
. как указал @Tal, функция as.dendrogram
вернула дерево в другом порядке, что приведет к неверным результатам, если мы вычислим корреляцию на основе результатов дендрограммы. Как показано на примере функции cor_cophenetic
, функция в пакете dendextend
:
set.seed(23235)
ss <- sample(1:150, 10 )
hc1 <- iris[ss,-5] %>% dist %>% hclust("com")
hc2 <- iris[ss,-5] %>% dist %>% hclust("single")
dend1 <- as.dendrogram(hc1)
dend2 <- as.dendrogram(hc2)
# cutree(dend1)
cophenetic(hc1)
cophenetic(hc2)
# notice how the dist matrix for the dendrograms have different orders:
cophenetic(dend1)
cophenetic(dend2)
cor(cophenetic(hc1), cophenetic(hc2)) # 0.874
cor(cophenetic(dend1), cophenetic(dend2)) # 0.16
# the difference is becasue the order of the distance table in the case of
# stats:::cophenetic.dendrogram will change between dendrograms!