Я использую пакет pdp в r для построения графика частичной зависимости.Используйте iris
данные в качестве примера.
library(randomForest)
library(pdp)
rf = randomForest(Species~., data = iris)
par.Sepal_l <- partial(rf, pred.var = c("Sepal.Length"))
plot.Sepal_l <- autoplot(par.Sepal_l, rug=TRUE, train = iris)
print(plot.Sepal_l)
Я получил график, как показано ниже:
Я использую опцию rug=TRUE
, чтобы показать распределение предиктора,Тем не менее, я считаю, что ковер вдоль оси х гораздо более разреженный, чем ожидалось.Я делаю что-то не так?Это не кажется правильным.Но я не мог понять, почему я теряю некоторые данные.
Заранее большое спасибо.