Как вы предоставляете класс для новых данных, которые не имеют класса?
Я использую алгоритм KNN, и вот код для моделирования. ( Текстовая классификация)
train_set <- sample(1:nrow(dtm.df), 15)
test_set <- (1:nrow(dtm.df))[- train_set]
# Isolate classifier
classifier <- dtm.df[, "class"]
# Create model data and remove "category"
model_data <- dtm.df[,!colnames(dtm.df) %in% "class"]
# Create model: training set, test set, training set classifier
knn.pred <- knn(model_data[train_set, ], model_data[test_set, ],
classifier[train_set], k=5)
Я пробую этот код
newdata <- data.frame(text="bagus sekali")
newdata <- Corpus(VectorSource(newdata))
newdata <- DocumentTermMatrix(newdata)
model = knn(model_data[train_set, ], newdata, classifier[train_set], k =5)
Ошибка в knn (model_data [train_set,], newdata, классификатор [train_set],: dims для 'test' и 'train' отличаются
Я знаю, что dims разные, test 37 378, а newdata 1 1.