Прогнозы Rpart с использованием суррогатных сплитов - PullRequest
0 голосов
/ 24 октября 2018

Я использую R и пакет rpart для прогнозирования.

Я понимаю, что модель rpart использует суррогатные разбиения в случае отсутствия значений данных, но когда я пытаюсь заставить мою модель делать прогнозы для набора данных с пропущенными значениями, я получаю сообщение об ошибке.

Как я могу заставить rpart использовать его суррогатные сплиты для прогнозирования?

Ниже приведен мой код.Все данные являются категориальными.

rtree.fit <- rpart(Pass..Y.N.~ a + b + c + d + e , 
                   data=data_training,
                   method="class",
                   parms = list(prior = c( 1-0.3 , 0.3), split = "gini"),
                   control=rpart.control(minsplit=30,cp=0.001, usesurrogate = 2))

df_predicting <- data.frame(
  a = "New York City",
  b = "Albania",
  c = "Whole",
  d = "Daim"
)

p <- predict(rtree.fit, df_predicting, type = "class")

Я получаю сообщение об ошибке

Error in eval(predvars, data, env) : object 'e' not found
...