Класс Балансировки с ROSE - PullRequest
0 голосов
/ 23 апреля 2019

У меня есть набор данных около 800000 строк, который я пытаюсь сбалансировать с помощью пакета ROSE в R. У меня есть класс 550000 строк, а другой 250000, и я пытаюсь иметь оба класса на 550000. Так что в основном я хотите, чтобы первый класс оставался неизменным, а только меньшинство переизбиралось.

Я пытался использовать ROSE с методом over и N = 1100000, который (основываясь на инструкциях, которым я следовал) должен пересчитать класс меньшинства до того же числа большинства.

new_train <- ovun.sample(target ~ ., data = train, method = "over", N = 1100000)$data

Полученные результаты показывают, что класс большинства был занижен до 350000, а класс меньшинства - 750000. Что может быть не так в моем коде или наборе данных?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...