Оценка силуэта предполагает, что лучший размер кластеров - два? - PullRequest
0 голосов
/ 03 ноября 2019

Я использую k-medoid для кластеризации набора данных в кластеры. Каждая точка данных - это данные большого размера. Но меня интересует только корреляция между точками данных, а не абсолютное значение данных (например, [1,2,1] и [3,6,3] должны быть помещены в один кластер), поэтому яиспользуйте корреляцию Пирсона в качестве расстояния (1-r, r = 1 означает положительную корреляцию). Я использую показатель силуэта, чтобы определить количество кластеров. Однако от размера кластера от 2 до 50 балл продолжает уменьшаться. Означает ли это, что 2 кластера - лучший выбор? Я не понимаю этоИз визуализации я увидел несколько различных шаблонов изменения стоимости.

...