Использование всего набора данных Поезда, но проблема Матрицы Путаницы - PullRequest
0 голосов
/ 25 сентября 2019

Я практикую логистическую регрессию на языке R.В инструкции написано ИСПОЛЬЗОВАТЬ ВХОДНЫЕ ДАННЫЕ В КАЧЕСТВЕ ДАННЫХ ОБУЧЕНИЯ, поэтому я написал полные данные о поезде с нулевыми данными испытаний.Поскольку я запускаю пакет Caret для матрицы путаницы, я не могу получить результат.что я пропустил?

rm(list = ls())
Admin.df <- read.csv("SystemAdministrators.csv")

library(dummies)
Admin.df<-data.frame(Completed=Admin.df$Completed,dummy.data.frame(Admin.df, names = "Completed",sep="_",
                                                                  dummy.classes =c("Yes", "No")))

selected.var <- c(1:3)

set.seed(2)
train.index <- sample(c(1:dim(Admin.df)[1]), dim(Admin.df)[1]*1)
train.Admin.df <- Admin.df[train.index, selected.var]
valid.Admin.df <- Admin.df[-train.index, selected.var]

logit.reg <- glm(Admin.df$Completed_Yes ~ ., data = train.Admin.df, family = "binomial") 
options(scipen=999) 
summary(logit.reg)

logit.reg.pred <- predict(logit.reg, train.Admin.df, type = "response") # not use valid data since no data
logit.reg.pred.class<-ifelse(logit.reg.pred > 0.5, 1, 0)


library(caret)
confusionMatrix(as.factor(logit.reg.pred.class), as.factor(train.Admin.df$Completed_Yes))
confusionMatrix(as.factor(ifelse(logit.reg.pred > 0.5, "Completed_Yes", "Completed_No")), 
                as.factor(ifelse(train.Admin.df$Completed_Yes==1,"Completed_Yes", "Completed_No")))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...