Вот три точки и иерархическая кластеризация с использованием hclust
в R с методом "центроид".
points <- data.frame(x = c(0, 1, 0.75),
y = c(0, 0, 1))
centroid <- hclust(dist(points), method = "centroid")
plot(centroid)
Полученная дендрограмма правильно объединяет первую и вторую точки.(Расстояние равно 1.) Центр тяжести первых двух точек находится в точке (0.5, 0).
Третья точка сливается на высоте 0.8903882, создавая инверсию (или инверсию, как ее называют некоторые).На самом деле, третья точка находится на расстоянии 1.030776 от центроида, поэтому инверсии не должно быть.
Чего мне здесь не хватает?