Я использую дерево решений в RPART для снижения скорости отключения, как показано ниже.Я сгруппировал по функциям и вычислил скорость, которую использует мой DT.
m<-rpart(disco_rate ~ ., method='anova',data=x,minbucket=50,maxdepth=10,cp=0.01,xval=3)
Однако мне нужно, чтобы disco_rate рассчитывался при каждом разделении, и на основании этого принималось решение о разделении.Для этого я передал набор данных с базой и дискотеками отдельно вместо ставки и предположил, что следующее будет работать
m<-rpart(discos/base ~ ., method='anova',data=y,minbucket=50,maxdepth=10,cp=0.01,xval=3)
, но похоже, что он сначала вычисляет disco_Rate, а не использует функцию дискотеки / базы в качествезависимая переменная на каждом уровне, потому что результаты обоих одинаковы.
Есть ли способ, которым я могу сделать это вычисление динамическим?