Несбалансированность пакета: ошибка «некоторые атрибуты класса не найдены в наборе данных» - PullRequest
0 голосов
/ 20 декабря 2018

Я хочу сбалансировать свои данные с пакетом imbalance, используя код передискретизации.При попытке этого кода выдает ошибку:

new_train <- oversample(train, method = "ADASYN")

Код ошибки :

Ошибка в checkDatasetClass (набор данных, classAttr): некоторые изатрибуты класса не найдены в наборе данных

мои данные выглядят так:

> head(train)
    case           country   steering     type           group 
1  bad              Europe      LL         AUT             3
2 good              Europe      LL         AUT             2
3 good              Europe      LL         AUT             2
4 good              Europe      LL         SCH             2
5 good              Europe      RL         AUT             2
6 good              Europe      LL         AUT             1

> str(train)
'data.frame':   11479 obs. of  5 variables:
 $ case : Factor w/ 2 levels "bad",..: 1 2 2 2 2 2 2 2 2 2 ...
 $ country: Factor w/ 9 levels "Africa","LatinAmerica",..: 6 6 6 6 6 6 6 6 6 6 ...
 $ steering: Factor w/ 2 levels "LL","RL": 1 1 1 1 2 1 2 1 1 1 ...
 $ type: Factor w/ 2 levels "AUT","SCH": 1 1 1 2 1 1 1 1 1 1 ...
 $ group: Factor w/ 3 levels "1","2","3": 3 2 2 2 2 1 2 3 3 2 ...

Я уже удалил NA с помощью

which(is.na(train))
train <- na.omit(train)

1 Ответ

0 голосов
/ 21 июня 2019

Укажите целевую переменную.Например:

serhat_simsek <- oversample(train, method = "ADASYN",classAttr = "group")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...