'train' и 'class' имеют разную длину ошибки - PullRequest
0 голосов
/ 04 февраля 2019

Я получаю сообщение об ошибке «класс и поезд имеют разную длину» при попытке использовать модель knn в моем наборе данных.

newDF<- newDF[c(14, 1:13)]
newDF
str(newDF)

newDF1 <- newDF[c(2:11, 14)]
newDF1

df_train = newDF1[1:47385,]
dim(df_train)

df_test = newDF1[47386:59231,]
dim(df_test)


train_lbl <- newDF[1:47385,1]
test_lbl <- newDF[47386:59231,1]
dim(train_lbl)

install.packages("class")
library(class)

newDF_pred <- knn(train = df_train, test = df_test, cl = train_lbl, k = 245)

CrossTable(x = test_lbl, y=newDF_pred, propchisq=FALSE)

newDF - это весь мой набор данных, в то время как newDF1 включает только тип данных "num"

Где проблема и как я могу ее исправить?

Этоданные: -10lgP Массовая длина ppm m/z RT начало конца Intensity Sample 9 Precursor Id диапазон 1 0,543 0,234 0,245 0,348 0,0310 0,543 0,234 0,245 0,348 0,0310 0,0254 2 0,198 0,476 0,499 0,348 0,588 0,198 0,476 0,499 0,348 0,588 0,0256 3 0,234 0,245 0,3480,0310 0,543 0,234 0,245 0,348 0,0310 0,543 0,0255 4 0,476 0,499 0,348 0,588 0,198 0,476 0,499 0,348 0,588 0,198 0,098 0,498 0,398 0,498 0,338 0,598 0,198 0,498 0,398 0,098 0,498 0,498 0,398 0,598 0,148 0,488 0,398 0,01 0,01 038 045 038 038 0 0,05 0,088 0,038 0,088 0,388 0,038 0,045 0,388 0,338 0,045 0,038 0,338 0,038 0,038 0,343 0,038 0,038 0,343 0,038 0,045 0,043 0,343 0,045 0,038 0,343 0,038 0,038 0,343 0,038 0,045 0,038 0,348 0,0380,348 0,0310 0,543 0,234 0,245 0,0255 8 0,348 0,588 0,198 0,476 0,499 0,348 0,588 0,198 0,476 0,499 0,0254 9 0,0310 0,543 0,234 0,245 0,348 0,0310 0,543 0,234 0,245 0,348 0,0254 10 0,588 0,198 0,476 0,499 0,348 0,588 0,198 0,476 0,499 0,348 0,0256

1013с 59,221 больше строк

СиДля класса и поезда: dim (train_lbl) [1] 47385 1

dim (df_train) [1] 47385 11

...