У меня относительно большой набор данных.Я хочу использовать Клару для кластеризации.Однако результаты Клары зависят от размера выборки.Таким образом, целью является не только определить количество кластеров, но и правильный размер выборки.Я знаю один пакет, где я могу "настроить" приложение Calra.
libary(factoextra)
fviz_nbclust(scale(mtcars),
FUNcluster = clara,
method = "wss",
k.max = 6)
Если я правильно понимаю концепцию, настройка samplesize
> 1 превращает Клару в Кларанс.
fviz_nbclust(scale(mtcars),
FUNcluster = clara,
method = "wss",
k.max = 6,
samplesize = 2)
Есть идеи, как получить правильный размер выборки для Клары (нс)?