Я применил алгоритм инкрементальной кластеризации для двухмерного набора данных с 1500 точками данных.Как вы можете видеть, красные точки кластера находятся внутри других кластеров.Это не обеспечивает аккуратный кластер.
Я тестировал с различными наборами данных и выглядит хорошо, за исключением этого набора данных.
У меня естьбыло сказано измерять значения ICC набора данных, чтобы определить, насколько тесно связаны точки данных.Я не знаю, как интерпретировать результаты ICC.
icc(dat, model="twoway", type = "agreement")
Результаты:
Single Score Intraclass Correlation
Model: twoway
Type : agreement
Subjects = 1500
Raters = 2
ICC(A,1) = 0.56
F-Test, H0: r0 = 0 ; H1: r0 > 0
F(1499,19.7) = 4.57 , p = 0.000114
95%-Confidence Interval for ICC Population Values:
0.294 < ICC < 0.71