Почему я получаю разные результаты PCA с использованием пакетов R (princomp) и Rcmdr? - PullRequest
1 голос
/ 21 июня 2020

У меня есть данные с 27 переменными (столбцами) и 125 образцами (строками). Я пытаюсь выполнить анализ PCA, используя этот сценарий:

library("FactoMineR")
library("factoextra")
library(ggplot2)
mydata<- read.csv("Overall.csv", TRUE, ",")
mydata[is.na(mydata)]=0
attach(mydata)
X=cbind (Adj..1_12, Adj..1_13, Adj..1_2, Adj..10_11, Adj..11_12, Adj..12_13, Adj..2_11, Adj..2_12, Adj..2_13,
         Adj..2_3, Adj..3_11, Adj..3_12, Adj..3_4, Adj..4_11, Adj..4_5, Adj..5_10, Adj..5_11, Adj..5_6,
         Adj..6_10, Adj..6_11, Adj..6_7, Adj..6_9, Adj..7_10, Adj..7_8, Adj..7_9, Adj..8_9, Adj..9_10)
summary(X)
cor(X)
res.pca <- princomp(X, scores=TRUE, cor=TRUE)
summary(res.pca)


fviz_pca_var(res.pca, col.var="contrib",
             gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
             repel = TRUE, # Avoid text overlapping
             axes = c(1, 2) # choose PCs to plot
)

Но я получаю результаты, отличные от результатов, предоставленных Rcmdr и SPSS !!! Первый (PC1) и второй (PC2) основные компоненты объясняются до 81,94% и 4,9% соответственно анализом PCA, выполненным с помощью пакетов SPSS и Rcmdr. В то время как использование приведенного выше сценария предоставило график PCA, который объяснил до 46,7% и 5,8% данных !! Может ли это быть из-за большего количества выборок (125 строк) ??

Но тот же сценарий правильно оценивает PCA для других данных (с меньшим количеством строк), аналогично тому, который предоставляется SPSS. Где ошибка ??

Большое спасибо

С уважением,

Умар

Доступ к необработанным данным

Результаты предоставлены Rcmdr и SPSS

Результаты предоставлены princomp () и prcomp ()

1 Ответ

0 голосов
/ 21 июня 2020

Наконец, я нашел ошибку. Фактически, я удалил выбросы из данных, поэтому в данных отсутствуют ячейки, которые заменены средними значениями в SPSS, и Rcmdr (из R), тогда как сценарий, который я использовал (приведенный выше), заменил эти отсутствующие ячейки / значения на ноль, что привело к полностью различная оценка PCA.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...