Разница между двумя функциями прогнозирования - PullRequest
1 голос
/ 02 апреля 2019

экспертов!

Я тестировал модель логистической регрессии на обучающем наборе данных.Я знал, что функция «Predict» может подсказать мне вероятность (type = «response») уникального события (в этом случае сотрудник покинул компанию).

Я также знал, что новыйПакет под названием «Tidypredict» выпущен в январе 2019 года, что также предсказывает вероятность события, происходящего с интервалом 95%.

Когда я попробовал эти два разных метода, он показывает разные вероятности для одного и того же сотрудника.

Я исследовал тему.Кажется, что лучший выбор времени для использования функции «Предсказать» - это когда конечный результат уже известен.Потому что мы можем сравнить и выяснить, насколько точной будет модель.

Функция «Tidypredict» используется, когда результат неизвестен.Может ли кто-нибудь сказать мне, в чем разница?Вот доступная информация: https://cran.r -project.org / web / packages / tidypredict / tidypredict.pdf

Прогноз: https://stat.ethz.ch/R-manual/R-devel/library/stats/html/predict.glm.html

Here is the results for anyone interested: 
test model:         
1         2         3         4         5         6 
0.6633092 0.2440294 0.2031897 0.9038319 0.8374229 0.1735053 
Tidypredict:

    Age         Los Gender Minority test.model       fit
1 xx.xx ThreeToFive   Male Minority  0.6633092 0.7116757
2 xx.xx   ZeroToOne   Male Minority  0.2440294 0.6834286
3 xx.xx   ZeroToOne Female Minority  0.2031897 0.6303713
4 xx.xx TentoTwenty   Male Minority  0.9038319 0.6963801
5 xx.xx ThreeToFive   Male Minority  0.8374229 0.8658365
6 xx.xx   ZeroToOne Female Minority  0.1735053 0.5840209



      #logistic model# 
model1=glm(Leave~.,family="binomial",data=train)
       #Predict function# 
    test.model<-predict(model1,newdata=test1,type="response")
      #Tidypredict function#
       emp_risk<-test1%>%
       tidypredict_to_column(model1)

1 Ответ

1 голос
/ 02 апреля 2019

Я не могу воспроизвести вашу проблему - вот воспроизводимый пример, иллюстрирующий, что предсказания predict() совпадают с предсказаниями tidypredict_to_column(). Мой совет - покопайтесь в конкретном примере, который не соответствует, и выясните разницу. Если вы разместите воспроизводимый пример, вы получите более конкретную помощь:

library(titanic)
library(dplyr)
library(tidypredict)
d <- titanic_train
mod <- glm(Survived ~ Pclass + Sex + Age + SibSp + Parch, data = d, family = "binomial")

d <- d %>% tidypredict_to_column(mod)
d$fit2 <- predict(mod, newdata = d, type = "response")
summary(d$fit - d$fit2)
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
#>       0       0       0       0       0       0     177

Создано в 2019-04-01 пакетом Представить (v0.2.1)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...