SMOTE Сокращенное количество наблюдений - PullRequest
0 голосов
/ 19 марта 2020

Я пытаюсь выполнить регрессию c для набора данных дефолта по ссуде и удивляюсь, почему SMOTE сократил количество наблюдений. Исходный набор данных имел 226786 наблюдений, и когда я побежал, общее количество наблюдений уменьшилось до 53440. Это нормально?

train$loan_status<-as.factor(train$loan_status)
train_smote <-SMOTE(loan_status~.,train,perc.over = 100,k = 5, perc.under = 200)

0 1 26720 26720

Спасибо

...