Неправильные метки в дереве rpart - PullRequest
0 голосов
/ 30 мая 2018

У меня проблема с метками при использовании rpart в R.

Вот моя ситуация.

Я работаю над набором данных с категориальными переменными, вот фрагмент моих данных

head(Dataset)
Entity  IL  CP  TD  Budget 
  2      1   3   2     250
  5      2   2   1     663
  6      1   2   3     526 
  2      3   1   2     522

когда я строю свое дерево решений, добавляя метки, используя

plot(tree) 
text(tree)

Я получаю неправильные метки: для Entity я получаю "abcd"

Почему яполучить это и как я могу это исправить?

Спасибо за вашу помощь

1 Ответ

0 голосов
/ 30 мая 2018

По умолчанию plot.rpart просто помечает уровни переменных факторов как letters, первый уровень будет a, второй b и так далее.Пример:

library(rpart)
library(ggplot2) #for the data

data("diamonds")    
df <- diamonds[1:2000,]

fit <- rpart(price ~ color + cut + clarity, data = df)
plot(fit)
text(fit)

enter image description here

По моему мнению, вместо настройки этого графика используйте специальный пакет для построения графиков rpart:

library(rpart.plot)
prp(fit)

enter image description here

имеет множество параметров настройки (пример):

prp(fit,
    type = 4,
    extra = 101,
    fallen.leaves = T,
    box.palette = colorRampPalette(c("red", "white", "green3"))(10),
    round = 2,
    branch.lty = 2,
    branch.lwd = 1,
    space = -1,
    varlen = 0,
    faclen = 0)

enter image description here

Другие параметрыэто:

library(rattle)
fancyRpartPlot(fit,
               type = 4)

enter image description here

, который использует prp внутри с различными значениями по умолчанию.

...