Я пытаюсь сбалансировать мой набор данных с ROSE из пакета ROSE. ROSE использует сглаженный подход начальной загрузки и соответствует оценке плотности ядра. Я понимаю оценку плотности ядра, однако я не могу понять, что такое сглаженный загрузчик и как новые данные (категориальные) создаются с помощью этого подхода.
Я уже попробовал функцию SMOTE и передискретизацию класса меньшинства.
library(ROSE)
rose_train <- ROSE(case~ ., train)
table(rose_train$`data`$case)
tree <- rpart(rose_train$`data`$case~ ., rose_train$`data`,
method = "class",
minsplit = 1, minbucket=1, maxdepth=3,
parms = list(split = "gini"),
cp = -1)
pred <- predict(tree,test, type ="class")
Я просто хочу знать, что такое сглаженный бутстрап и как он работает для ROSE.