Как разделить набор данных на X и Y, обучить и протестировать, чтобы выполнить логистическую регрессию на наборе поездов - PullRequest
0 голосов
/ 24 июня 2019

Я пытаюсь разделить набор данных об утверждении кредита на Обучение и тестирование. 590 рядов для обучения и отдыха для теста. Переменная «Y» будет утвержденным столбцом, а переменная «X» будет оставшейся частью столбцов.

Как только это будет сделано, мне нужно запустить логистическую регрессию на наборе поездов.

 df.credit[,1:15]
 dim(X)
df.credit$Approved
    y <- as.numeric(df.credit$Approved)
    unique(Approved)
    y
    head(y,20)
    head(df.credit$Approved, 20)
    X_train <- X[1:590,]
    y_train <- y[1:590]
    X_test <- X[591:690,]
    y_test <- y[591:690]
    fit1 <- glm(Approved~., data=X_train)
    fit0 <- glm(Approved~1, data=X_train)
    library(MASS)
    step <-stepAIC(fit0,direction="forward",scope=list(upper=fit1,lower=fit0))
    step

Следующая ошибка выдается при попытке запустить код:

Ошибка в model.frame.default (формула = Approved ~., Data = X_train, drop.unused.levels = TRUE): переменные длины различаются (найдено для «Male»)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...