Мои данные спектры. Как 400 строк спектров и 600 столбцов (признаков) - это разные волновые числа для каждого спектрального наблюдения. Я знаю, как выполнить PCA для данных. Но PCA для SVM сложен для меня. Мне удалось разделить данные обучения и тестирования для моего набора данных. Здесь я упомянул это как mydata. mydata была скорректирована в фоновом режиме и нормализована вектор перед подачей в PCA. После следующих шагов я не знаю, как выполнить SVM и визуализировать его?
set.seed(3456)
trainIndex=createDataPartition(mydata$labelling.id,p=0.8,list=FALSE)
head(trainIndex)
dataTrain <- mydata[ trainIndex,]
dataTest <- mydata[-trainIndex,]
##PCA
PCA= preProcess(dataTrain[,-631],method='pca',pcaComp = 2) ###because 631st column contains the labelling id
train = predict(PCA, dataTrain) # column orders change. The DV becomes the first variable
test = predict(PCA, dataTest)
## Rearranging the columns
train = train[,c(2,3,1)] ##such as PC1, PC2, labelling.id
test = test[,c(2,3,1)]