Определение размера выборки в Кларе (Clarans) - PullRequest
0 голосов
/ 05 июня 2019

У меня относительно большой набор данных.Я хочу использовать Клару для кластеризации.Однако результаты Клары зависят от размера выборки.Таким образом, целью является не только определить количество кластеров, но и правильный размер выборки.Я знаю один пакет, где я могу "настроить" приложение Calra.

libary(factoextra)

fviz_nbclust(scale(mtcars), 
             FUNcluster = clara, 
             method = "wss", 
             k.max = 6)

Если я правильно понимаю концепцию, настройка samplesize> 1 превращает Клару в Кларанс.

fviz_nbclust(scale(mtcars), 
             FUNcluster = clara, 
             method = "wss", 
             k.max = 6, 
             samplesize = 2)

Есть идеи, как получить правильный размер выборки для Клары (нс)?

1 Ответ

0 голосов
/ 02 июля 2019

Столько, сколько вы можете себе позволить.

Я сомневаюсь, что выбор размера выборки> 1 делает это CLARANS, потому что они довольно разные, если я правильно помню. Но если вы выполните выборку всей базы данных, CLARA по определению станет PAM.

Недавно была опубликована статья о более быстрых версиях PAM, CLARA, CLARANS. Убедитесь, что вы используете более быстрые версии ...

...