Я загрузил свои данные с веб-сайта UCI, и после того, как я подготовил свои данные, я сделал PCA, используя встроенную функцию prcomp
.
Размерность данных (569) (32). Это мои данные
Data<- read.table("http://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/wdbc.data",sep=",",stringsAsFactors = FALSE)
prin_comp <- prcomp(Data)
Это ярлыки ПК
PC1 PC2 PC3 PC4 PC5 PC6 PC7
[1,] -1160.142574 -293.9175436 -48.57839763 8.71197531 -32.00048607 1.265414807 0.931336973
[2,] -1269.122443 15.6301818 35.39453423 -17.86128323 4.33487404 -0.225871776 -0.046037222
[3,] -995.793889 39.1567432 1.70975298 -4.19934010 0.46652912 -2.652811158 -0.779744676
[4,] 407.180803 -67.3803198 -8.67284783 11.75986732 -7.11546109 1.299436158 -1.267304237
Причиной проведения PCA является уменьшение размерности.
У меня вопрос, как определить ПК с помощью перекрестной проверки в R.