Дерево решений, производящее значение 0.5 при разбиении для двоичных переменных - PullRequest
0 голосов
/ 26 сентября 2018

У меня есть много категориальных переменных, которые я преобразовал в фиктивную переменную по одной горячей кодировке для каждой из функций и построил дерево решений в R. Я не могу понять вывод.Может кто-нибудь, пожалуйста, помогите мне объяснить, как разделенный узел может иметь значение 0,5 в качестве значения, если переменная имеет только 0 или 1. Код и дерево решений ниже

mtree <- rpart(Converted~., data = training, method="class",
               control = rpart.control(minsplit = 20, minbucket = 7, maxdepth = 5,
                                       usesurrogate = 2, xval =10 ))

rpart.plot(mtree, # middle graph
           type=4,
           extra=101, 
           box.palette="GnBu",
           branch.lty=3, 
           shadow.col="gray", 
           nn=TRUE,cex = 1
)

Дерево решений Дерево

Пример: для переменной Месяц июнь, которая имеет горячее кодирование, как объяснить Месяц. Июнь> = 0,5

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...