экспертов!
Я тестировал модель логистической регрессии на обучающем наборе данных.Я знал, что функция «Predict» может подсказать мне вероятность (type = «response») уникального события (в этом случае сотрудник покинул компанию).
Я также знал, что новыйПакет под названием «Tidypredict» выпущен в январе 2019 года, что также предсказывает вероятность события, происходящего с интервалом 95%.
Когда я попробовал эти два разных метода, он показывает разные вероятности для одного и того же сотрудника.
Я исследовал тему.Кажется, что лучший выбор времени для использования функции «Предсказать» - это когда конечный результат уже известен.Потому что мы можем сравнить и выяснить, насколько точной будет модель.
Функция «Tidypredict» используется, когда результат неизвестен.Может ли кто-нибудь сказать мне, в чем разница?Вот доступная информация: https://cran.r -project.org / web / packages / tidypredict / tidypredict.pdf
Here is the results for anyone interested:
test model:
1 2 3 4 5 6
0.6633092 0.2440294 0.2031897 0.9038319 0.8374229 0.1735053
Tidypredict:
Age Los Gender Minority test.model fit
1 xx.xx ThreeToFive Male Minority 0.6633092 0.7116757
2 xx.xx ZeroToOne Male Minority 0.2440294 0.6834286
3 xx.xx ZeroToOne Female Minority 0.2031897 0.6303713
4 xx.xx TentoTwenty Male Minority 0.9038319 0.6963801
5 xx.xx ThreeToFive Male Minority 0.8374229 0.8658365
6 xx.xx ZeroToOne Female Minority 0.1735053 0.5840209
#logistic model#
model1=glm(Leave~.,family="binomial",data=train)
#Predict function#
test.model<-predict(model1,newdata=test1,type="response")
#Tidypredict function#
emp_risk<-test1%>%
tidypredict_to_column(model1)