Динамическая формула в дереве решений RPART - PullRequest
0 голосов
/ 16 октября 2018

Я использую дерево решений в RPART для снижения скорости отключения, как показано ниже.Я сгруппировал по функциям и вычислил скорость, которую использует мой DT.

m<-rpart(disco_rate ~  ., method='anova',data=x,minbucket=50,maxdepth=10,cp=0.01,xval=3)

Однако мне нужно, чтобы disco_rate рассчитывался при каждом разделении, и на основании этого принималось решение о разделении.Для этого я передал набор данных с базой и дискотеками отдельно вместо ставки и предположил, что следующее будет работать

m<-rpart(discos/base ~  ., method='anova',data=y,minbucket=50,maxdepth=10,cp=0.01,xval=3)

, но похоже, что он сначала вычисляет disco_Rate, а не использует функцию дискотеки / базы в качествезависимая переменная на каждом уровне, потому что результаты обоих одинаковы.

Есть ли способ, которым я могу сделать это вычисление динамическим?

...