Я получаю сообщение об ошибке «класс и поезд имеют разную длину» при попытке использовать модель knn в моем наборе данных.
newDF<- newDF[c(14, 1:13)]
newDF
str(newDF)
newDF1 <- newDF[c(2:11, 14)]
newDF1
df_train = newDF1[1:47385,]
dim(df_train)
df_test = newDF1[47386:59231,]
dim(df_test)
train_lbl <- newDF[1:47385,1]
test_lbl <- newDF[47386:59231,1]
dim(train_lbl)
install.packages("class")
library(class)
newDF_pred <- knn(train = df_train, test = df_test, cl = train_lbl, k = 245)
CrossTable(x = test_lbl, y=newDF_pred, propchisq=FALSE)
newDF - это весь мой набор данных, в то время как newDF1 включает только тип данных "num"
Где проблема и как я могу ее исправить?
Этоданные: -10lgP
Массовая длина ppm m/z
RT начало конца Intensity Sample 9
Precursor Id
диапазон 1 0,543 0,234 0,245 0,348 0,0310 0,543 0,234 0,245 0,348 0,0310 0,0254 2 0,198 0,476 0,499 0,348 0,588 0,198 0,476 0,499 0,348 0,588 0,0256 3 0,234 0,245 0,3480,0310 0,543 0,234 0,245 0,348 0,0310 0,543 0,0255 4 0,476 0,499 0,348 0,588 0,198 0,476 0,499 0,348 0,588 0,198 0,098 0,498 0,398 0,498 0,338 0,598 0,198 0,498 0,398 0,098 0,498 0,498 0,398 0,598 0,148 0,488 0,398 0,01 0,01 038 045 038 038 0 0,05 0,088 0,038 0,088 0,388 0,038 0,045 0,388 0,338 0,045 0,038 0,338 0,038 0,038 0,343 0,038 0,038 0,343 0,038 0,045 0,043 0,343 0,045 0,038 0,343 0,038 0,038 0,343 0,038 0,045 0,038 0,348 0,0380,348 0,0310 0,543 0,234 0,245 0,0255 8 0,348 0,588 0,198 0,476 0,499 0,348 0,588 0,198 0,476 0,499 0,0254 9 0,0310 0,543 0,234 0,245 0,348 0,0310 0,543 0,234 0,245 0,348 0,0254 10 0,588 0,198 0,476 0,499 0,348 0,588 0,198 0,476 0,499 0,348 0,0256
1013с 59,221 больше строк
СиДля класса и поезда: dim (train_lbl) [1] 47385 1
dim (df_train) [1] 47385 11