Как определить размеры в fviz_cluster с данными PAM? - PullRequest
0 голосов
/ 22 апреля 2019

У меня есть фрейм данных, который делится на выборки в строках и переменные в столбцах

После выполнения PCA:

   df.pca <- PCA(df, graph = FALSE, ncp = Inf)
   df.coord <- data.frame(df.pca$ind$coord)

, а затем k-означает на моих данных PCA:

   df.kmeans = kmeans(df.coord, 3, nstart = 25) 

и для визуализации формирования кластера:

   fviz.cluster(object = df.kmeans, data = df.pca)

Я получаю хороший график с правильными размерами (dim1 75% и dim 2 12% для моих данных, рассчитанных PCA).

Но если я делаю то же самое с алгоритмом k-medoid (PAM):

   df.pca <- PCA(df, graph = FALSE, ncp = Inf)
   df.coord <- data.frame(flies.todos.pca$ind$coord)
   df.pam = pam(df.coord, 3, nstart = 25)  

   fviz.cluster(object = df.pam, data = df.pca)

Я получаю неправильные размеры (dim1 3.4%, dim 2 3.4%) с точно таким жеdata.

Как я могу определить размеры для PCA?

Я пытался:

    fviz.cluster(object = df.pam, data = df.coord)
    fviz.cluster(object = df.pam, data = df)

безуспешно, я всегда получаю 3,4% измерений, которые недаже близко к значениям PCA

1 Ответ

0 голосов
/ 22 апреля 2019

Ну, после простого изучения я уже знаю ответ.Для функции pam () PCA всегда выполняется автоматически.В общем, я делал PCA на данных PCA, что не имеет никакого смысла.Если вы собираетесь использовать pam () или любой другой алгоритм кластеризации, проверьте, выполняется ли PCA автоматически!

...