Выбор количества главных компонентов с помощью перекрестной проверки в R - PullRequest
0 голосов
/ 07 сентября 2018

Я загрузил свои данные с веб-сайта UCI, и после того, как я подготовил свои данные, я сделал PCA, используя встроенную функцию prcomp. Размерность данных (569) (32). Это мои данные

Data<- read.table("http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/wdbc.data",sep=",",stringsAsFactors = FALSE)

prin_comp <- prcomp(Data)

Это ярлыки ПК

            PC1          PC2           PC3          PC4          PC5          PC6          PC7
  [1,] -1160.142574 -293.9175436  -48.57839763   8.71197531 -32.00048607  1.265414807  0.931336973
  [2,] -1269.122443   15.6301818   35.39453423 -17.86128323   4.33487404 -0.225871776 -0.046037222
  [3,]  -995.793889   39.1567432    1.70975298  -4.19934010   0.46652912 -2.652811158 -0.779744676
  [4,]   407.180803  -67.3803198   -8.67284783  11.75986732  -7.11546109  1.299436158 -1.267304237

Причиной проведения PCA является уменьшение размерности.

У меня вопрос, как определить ПК с помощью перекрестной проверки в R.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...