Я пытаюсь использовать библиотеку ROSE для R, чтобы перебалансировать целевую переменную в моем наборе данных.
Вот моя информация о моем наборе данных.
- В моем исходном наборе данных всего 132056 записей.
- В целевой переменной всего 279 случаев (0,21%) младшего класса.
- В целевой переменной всего 131777 случаев (99,79%) основного класса.
Я хотел бы занизить выборку набора данных, чтобы процент незначительных классов увеличился до 5%.
Вот мой код:
df_Under <- ovun.sample(Target ~ ., data = df, method = "under", N =5580, seed = 1)
Тем не менее, после выполнения кода выше, я получил следующее сообщение об ошибке.
"Error in (function (formula, data, method, subset, na.action, N, p = 0.5, :Too few observations."
Я попытался поиграть с другим методом ROSE, таким как «over» и «both», но возникает та же ошибка.
Как я могу исправить эту проблему?
С уважением,