R AppliedPredictiveModeling Преобразование данных - почему добавление пространственного знака в функцию preProcess удваивает выходные переменные? - PullRequest
0 голосов
/ 22 октября 2019

In Прикладное прогнозирующее моделирование Глава 3, упражнение 3.1.a. Вопрос сосредоточен на предварительной обработке набора данных Glass из mlbench. После удаления кальция я перехожу к preprocess () для центрирования, масштабирования и выполнения PCA. В одной версии я также добавляю пространственный знак после pca, что приводит к тому же PCA, что и к преобразованным версиям всех 7 переменных. Почему добавление пространственного знака приводит к добавлению обработанных числовых переменных в выходные данные?

*# filteredGlass is Glass without the Calcium column*

glasstrans   <- preProcess(filteredGlass, 
                          method = c("BoxCox", "center", "scale", "pca"))
transformed  <- predict(glasstrans, filteredGlass[,1:8])

names(transformed) *# Returns 7 PC's* 



glasstrans2  <- preProcess(filteredGlass, 
                         method = c("BoxCox", "center", "scale", "pca","spatialSign"))
transformed2 <- predict(glasstrans2, filteredGlass[, 1:8)

names(transformed2) *# Returns 7 PC's plus all 8 numeric variables in filteredGlass*

имена (преобразованные) [1] "ПК1" "ПК2" "ПК3" "ПК4" "ПК5" "ПК6" "ПК7"

имена (преобразованные2) [1]"RI" "Na" "Mg" "Al" "Si" "K" "Ba" "Fe" "PC1" "PC2" "PC3" "PC4" "PC5" "PC6" "PC7"

...