КНН для прогнозирования класса из новых данных - PullRequest
0 голосов
/ 13 января 2020

Как вы предоставляете класс для новых данных, которые не имеют класса?

Я использую алгоритм KNN, и вот код для моделирования. ( Текстовая классификация)

train_set <- sample(1:nrow(dtm.df), 15)
test_set <- (1:nrow(dtm.df))[- train_set]

# Isolate classifier
classifier <- dtm.df[, "class"]

# Create model data and remove "category"
model_data <- dtm.df[,!colnames(dtm.df) %in% "class"]

# Create model: training set, test set, training set classifier
knn.pred <- knn(model_data[train_set, ], model_data[test_set, ],
classifier[train_set], k=5)

Я пробую этот код

newdata <- data.frame(text="bagus sekali")
newdata <- Corpus(VectorSource(newdata))
newdata <- DocumentTermMatrix(newdata)
model = knn(model_data[train_set, ], newdata, classifier[train_set], k =5)

Ошибка в knn (model_data [train_set,], newdata, классификатор [train_set],: dims для 'test' и 'train' отличаются

Я знаю, что dims разные, test 37 378, а newdata 1 1.

...