PCA баллы против Varimax-повернутых баллов PCA - PullRequest
0 голосов
/ 31 августа 2018

Я выполнил PCA, используя prcomp в R с моими базами данных 75-76 индикаторных переменных и 7232 компаний, включая NA. Перед применением функции я центрировал свои данные, но не масштабировал их, потому что все они являются переменными индикатора. (Правильно ли мое рассуждение?)

После этого я varimax повернул нагрузки на 2 или 3 первых главных компонента, следуя инструкциям amoeba здесь .

Поскольку я центрировал, но не перемасштабировал свои данные, я изменил код на:

Varimax_results <- varimax(rawLoadings,normalize = FALSE)
invLoadings     <- t(pracma::pinv(VarimaxLoadings))
scores          <- scale(DatosPCA, scale = FALSE) %*% invLoadings

Теперь я пытаюсь выяснить, почему оценки, полученные с помощью «prcomp», и оценки, полученные с помощью приведенного выше кода, не совпадают.

Вероятно, мне не хватает каких-то теоретических основ, поэтому я был бы признателен, если бы кто-нибудь сказал мне, должны ли оценки быть одинаковыми и, в этом случае, что я делаю неправильно в своем коде. Если они не должны быть одинаковыми, какие из них мне следует использовать?

Большое спасибо!

...