Почему hclust показывает инверсию здесь? - PullRequest
0 голосов
/ 04 декабря 2018

Вот три точки и иерархическая кластеризация с использованием hclust в R с методом "центроид".

points <- data.frame(x = c(0, 1, 0.75),
                     y = c(0, 0, 1))
centroid <- hclust(dist(points), method = "centroid")
plot(centroid)

Полученная дендрограмма правильно объединяет первую и вторую точки.(Расстояние равно 1.) Центр тяжести первых двух точек находится в точке (0.5, 0).

Третья точка сливается на высоте 0.8903882, создавая инверсию (или инверсию, как ее называют некоторые).На самом деле, третья точка находится на расстоянии 1.030776 от центроида, поэтому инверсии не должно быть.

Чего мне здесь не хватает?

1 Ответ

0 голосов
/ 04 декабря 2018

Это в основном из-за метода, который вы использовали, который является центроид.Выберите другой метод (монотонные методы), такие как Средняя связь для одной связи Полная средняя связь Для взвешенной средней связи Связь WARD

...