Как ROSE создает новые синтетические образцы данных? - PullRequest
0 голосов
/ 08 января 2019

Я пытаюсь сбалансировать мой набор данных с ROSE из пакета ROSE. ROSE использует сглаженный подход начальной загрузки и соответствует оценке плотности ядра. Я понимаю оценку плотности ядра, однако я не могу понять, что такое сглаженный загрузчик и как новые данные (категориальные) создаются с помощью этого подхода.

Я уже попробовал функцию SMOTE и передискретизацию класса меньшинства.

library(ROSE)
rose_train <- ROSE(case~ ., train)

table(rose_train$`data`$case)


tree <- rpart(rose_train$`data`$case~ ., rose_train$`data`, 
            method    = "class", 
            minsplit  = 1, minbucket=1, maxdepth=3, 
            parms     = list(split = "gini"), 
            cp        = -1)
pred <- predict(tree,test, type ="class")

Я просто хочу знать, что такое сглаженный бутстрап и как он работает для ROSE.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...