Я использую R и пакет rpart
для прогнозирования.
Я понимаю, что модель rpart
использует суррогатные разбиения в случае отсутствия значений данных, но когда я пытаюсь заставить мою модель делать прогнозы для набора данных с пропущенными значениями, я получаю сообщение об ошибке.
Как я могу заставить rpart
использовать его суррогатные сплиты для прогнозирования?
Ниже приведен мой код.Все данные являются категориальными.
rtree.fit <- rpart(Pass..Y.N.~ a + b + c + d + e ,
data=data_training,
method="class",
parms = list(prior = c( 1-0.3 , 0.3), split = "gini"),
control=rpart.control(minsplit=30,cp=0.001, usesurrogate = 2))
df_predicting <- data.frame(
a = "New York City",
b = "Albania",
c = "Whole",
d = "Daim"
)
p <- predict(rtree.fit, df_predicting, type = "class")
Я получаю сообщение об ошибке
Error in eval(predvars, data, env) : object 'e' not found