Уменьшить большой набор данных - PullRequest
0 голосов
/ 10 февраля 2019

У меня большой набор данных о 10K данных.Поэтому я хочу уменьшить набор данных.Я собираюсь использовать Анализ основных компонентов (PCA) в качестве метода уменьшения размерности.Мой набор данных состоит из двоичных битов.

Мне удается использовать PCA с помощью функции prcomp.Однако у меня возникла проблема с обрезкой данных (с помощью функции обрезки).

install.packages("FSelector")    
library("FSelector")    
data<-f2    
weight <- prcomp(data, scale = FALSE)    
weight    
subset <- cutoff.k(weight, 100)    
subset    
f <- as.simple.formula(subset, "Class")    
f    
newdata <-  data.frame(data[,cutoff.k(weight, 100)])    
newdata  

Я ожидаю, что набор данных будет меньше, чем фактический набор данных.

Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...