partykit: дерево регрессии - идентифицируйте выбросы на блокпостах конечных узлов - PullRequest
0 голосов
/ 20 декабря 2018

Дерево регрессии, созданное с использованием приведенного ниже кода, имеет блок-графики для всех терминальных узлов.На коробочных диаграммах показаны медиана, IQR и выбросы, что очень здорово.

plot(as.party(tree), terminal_panel = node_boxplot)

Но как мне определить выбросы на моих коробочных диаграммах?Я полагал, что, так как коробочные графики уже были созданы, должно быть относительно легко вытащить выбросы, но информация, кажется, не хранится в дереве.Я знаю, что могу проследить пути своего дерева, чтобы определить выбросы в моем наборе данных, но мне было интересно, есть ли более быстрый способ сделать это.

1 Ответ

0 голосов
/ 20 декабря 2018

Поскольку вы не предоставляете данные, я сделаю это со встроенными cars данными.
Вы правы, что эта информация, похоже, не хранится в дереве.Также сюжет не обеспечивает значимого возврата.По крайней мере, один из способов добиться этого - просто переделать коробки с помощью boxplot, и вы можете получить выбросы.

library(rpart)
library(partykit)

CarTree = rpart(dist ~ ., data=cars)
PCT = as.party(CarTree)
P = plot(PCT, terminal_panel = node_boxplot)

BP = boxplot(cars$dist ~ PCT[1]$fitted[[1]])
BP$out
[1] 80
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...