Почему я получаю ошибку при попытке создать путаницу в дереве решений? - PullRequest
0 голосов
/ 05 июня 2019

Я учусь использовать деревья решений в г.

Я сделал модель и сделал прогноз.Я хочу проверить точность моей модели.Но когда я пытался создать матрицу путаницы, используя табличную функцию, я получаю сообщение об ошибке:

Ошибка в таблице (test_data $ Outcome, pregntn): все аргументы должны иметь одинаковую длину

Код, который я использовал:

data =  read.csv("C:/Users/VIJAY/Desktop/ML/logistic regression/diabetes.csv")

head(data)
dim(data)


library(rpart)
library(rpart.plot)
library(caret)

s = sample(768,600)

train_data = data[s,]
test_data = data[-s,]

model = rpart(Outcome ~.,data = train_data, method = "class")
rpart.plot(model,cex = .9)

predictn = predict(model,data= test_data,type = "class")

tab = table(test_data$Outcome,predictn)

1 Ответ

2 голосов
/ 05 июня 2019

Ваш ответ из набора тестов и прогнозов имеет разную длину. Я бы сказал, что прогнозы не были сделаны для всех наблюдений (возможно, из-за пропущенных значений некоторых предикторов - для этого рассмотрите возможность использования суррогатных переменных или удаления строк, у которых отсутствуют значения в этих предикторах, в наборе тестов).

Кстати, когда вы используете каретку, есть хорошая функция каретки :: confusionMatrix ()

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...