У меня большой набор данных о 10K данных.Поэтому я хочу уменьшить набор данных.Я собираюсь использовать Анализ основных компонентов (PCA) в качестве метода уменьшения размерности.Мой набор данных состоит из двоичных битов.
Мне удается использовать PCA с помощью функции prcomp.Однако у меня возникла проблема с обрезкой данных (с помощью функции обрезки).
install.packages("FSelector")
library("FSelector")
data<-f2
weight <- prcomp(data, scale = FALSE)
weight
subset <- cutoff.k(weight, 100)
subset
f <- as.simple.formula(subset, "Class")
f
newdata <- data.frame(data[,cutoff.k(weight, 100)])
newdata
Я ожидаю, что набор данных будет меньше, чем фактический набор данных.
Спасибо.