Найти Точность метода агломерации? - PullRequest
0 голосов
/ 10 октября 2019

Я построил дендрограмму, используя метод максимальной агломерации.

hc <- hclust(distance_matrix, method = "complete")
plot(hc, hang = 0, labels=ilpd_df$Class)

Q1) Как я могу найти точность этого метода агломерации?

Q2) Как следует прокомментировать чувствительность тестовых данных к методу агломерации?

Спасибо =)

1 Ответ

1 голос
/ 12 октября 2019

Кластерный анализ носит исследовательский, а не прогностический характер.

Точность имеет смысл при прогнозировании, но не так сильно при исследовании данных. Вы не сможете просто применить этот метод кластеризации к новой точке данных!

Наиболее близким по точности является, вероятно, индекс Рэнда, если вы действительно пометили данные. Это точность прогноза для пары точек, имеют ли они одинаковую метку, или нет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...