Я пытаюсь разделить набор данных об утверждении кредита на Обучение и тестирование. 590 рядов для обучения и отдыха для теста. Переменная «Y» будет утвержденным столбцом, а переменная «X» будет оставшейся частью столбцов.
Как только это будет сделано, мне нужно запустить логистическую регрессию на наборе поездов.
df.credit[,1:15]
dim(X)
df.credit$Approved
y <- as.numeric(df.credit$Approved)
unique(Approved)
y
head(y,20)
head(df.credit$Approved, 20)
X_train <- X[1:590,]
y_train <- y[1:590]
X_test <- X[591:690,]
y_test <- y[591:690]
fit1 <- glm(Approved~., data=X_train)
fit0 <- glm(Approved~1, data=X_train)
library(MASS)
step <-stepAIC(fit0,direction="forward",scope=list(upper=fit1,lower=fit0))
step
Следующая ошибка выдается при попытке запустить код:
Ошибка в model.frame.default (формула = Approved ~., Data = X_train, drop.unused.levels = TRUE): переменные длины различаются (найдено для «Male»)