В чем разница между параметром nearZeroVar () и параметром 'nzv' в preProcess () в пакете вставки в R? - PullRequest
0 голосов
/ 12 марта 2019

Я использую функцию nearZeroVar () из пакета Caret, чтобы найти столбцы с почти нулевой дисперсией.Он обнаруживает 10 столбцов из набора данных.

predictorInfo = nearZeroVar(new_train,saveMetrics = TRUE)
new_train = new_train[,!predictorInfo$nzv]
dim(new_train)

Затем я попробовал параметр 'nzv' в функции preProcess () для того же набора данных, но он может обнаружить только шесть столбцов из набора данных.

a<-preProcess(new_train, c('nzv'))
new_train=predict(a, newdata=new_train)
dim(new_train)

Мой вопрос: почему он показывает разные результаты для одного и того же набора данных?Есть ли разница между функцией nearZeroVar () и параметром 'nzv' в функции preProcess ()?

...