Модель логистической регрессии с бинарной переменной ответа не выводит 1 и 0 при использовании предиката () - PullRequest
0 голосов
/ 10 июня 2019

У меня есть тренировочные и тестовые наборы данных.Зависимая переменная является двоичной, и я преобразовал ее в «1» и «0» вместо «да / нет».Остальные переменные являются категориальными (не более трех категорий), числовыми (пропорции) и целыми числами.Я не нормализовал и не стандартизировал никакие переменные заранее.

У меня есть код, который работал над предыдущей проблемой, которая не работает в моем текущем проекте, и я не могу понять точно, почему, хотя я думаю, что я точно определил проблему.

Это выглядитнапример, когда я применяю модель к каждому из наборов обучающих и тестовых данных, она предсказывает значения, которые являются десятичными числами, а не «1» и «0».

Поэтому, когда я иду вычислять ошибку теста,Я получаю 100%, потому что ни одно из этих предсказанных значений не соответствует ни одному из «1» и «0» в наборах данных.

Любая помощь приветствуется

logisticmodel<-glmnet(train2.loan_status~.,data=train2, family = "binomial")


#training error
logisticmodel.train.pred<-predict(logisticmodel, newdata = train2)

1-сумма (logisticmodel.train.pred == train2 $ train2.loan_status) / длина (logisticmodel.pred)

#testing error
colnames(testfinal)<-colnames(train2)
logisticmodel.test.pred<-predict(logisticmodel, newdata = testfinal)

1-сумма (logisticmodel.test.pred == testfinal $ train2.loan_status) / длина (logisticmodel.test.pred)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...