Я выполнил PCA, используя prcomp
в R с моими базами данных 75-76 индикаторных переменных и 7232 компаний, включая NA. Перед применением функции я центрировал свои данные, но не масштабировал их, потому что все они являются переменными индикатора. (Правильно ли мое рассуждение?)
После этого я varimax
повернул нагрузки на 2 или 3 первых главных компонента, следуя инструкциям amoeba здесь .
Поскольку я центрировал, но не перемасштабировал свои данные, я изменил код на:
Varimax_results <- varimax(rawLoadings,normalize = FALSE)
invLoadings <- t(pracma::pinv(VarimaxLoadings))
scores <- scale(DatosPCA, scale = FALSE) %*% invLoadings
Теперь я пытаюсь выяснить, почему оценки, полученные с помощью «prcomp», и оценки, полученные с помощью приведенного выше кода, не совпадают.
Вероятно, мне не хватает каких-то теоретических основ, поэтому я был бы признателен, если бы кто-нибудь сказал мне, должны ли оценки быть одинаковыми и, в этом случае, что я делаю неправильно в своем коде. Если они не должны быть одинаковыми, какие из них мне следует использовать?
Большое спасибо!