Я практикую логистическую регрессию на языке R.В инструкции написано ИСПОЛЬЗОВАТЬ ВХОДНЫЕ ДАННЫЕ В КАЧЕСТВЕ ДАННЫХ ОБУЧЕНИЯ, поэтому я написал полные данные о поезде с нулевыми данными испытаний.Поскольку я запускаю пакет Caret для матрицы путаницы, я не могу получить результат.что я пропустил?
rm(list = ls())
Admin.df <- read.csv("SystemAdministrators.csv")
library(dummies)
Admin.df<-data.frame(Completed=Admin.df$Completed,dummy.data.frame(Admin.df, names = "Completed",sep="_",
dummy.classes =c("Yes", "No")))
selected.var <- c(1:3)
set.seed(2)
train.index <- sample(c(1:dim(Admin.df)[1]), dim(Admin.df)[1]*1)
train.Admin.df <- Admin.df[train.index, selected.var]
valid.Admin.df <- Admin.df[-train.index, selected.var]
logit.reg <- glm(Admin.df$Completed_Yes ~ ., data = train.Admin.df, family = "binomial")
options(scipen=999)
summary(logit.reg)
logit.reg.pred <- predict(logit.reg, train.Admin.df, type = "response") # not use valid data since no data
logit.reg.pred.class<-ifelse(logit.reg.pred > 0.5, 1, 0)
library(caret)
confusionMatrix(as.factor(logit.reg.pred.class), as.factor(train.Admin.df$Completed_Yes))
confusionMatrix(as.factor(ifelse(logit.reg.pred > 0.5, "Completed_Yes", "Completed_No")),
as.factor(ifelse(train.Admin.df$Completed_Yes==1,"Completed_Yes", "Completed_No")))