Я использую функцию nearZeroVar () из пакета Caret, чтобы найти столбцы с почти нулевой дисперсией.Он обнаруживает 10 столбцов из набора данных.
predictorInfo = nearZeroVar(new_train,saveMetrics = TRUE)
new_train = new_train[,!predictorInfo$nzv]
dim(new_train)
Затем я попробовал параметр 'nzv' в функции preProcess () для того же набора данных, но он может обнаружить только шесть столбцов из набора данных.
a<-preProcess(new_train, c('nzv'))
new_train=predict(a, newdata=new_train)
dim(new_train)
Мой вопрос: почему он показывает разные результаты для одного и того же набора данных?Есть ли разница между функцией nearZeroVar () и параметром 'nzv' в функции preProcess ()?