Регрессия с категориальной переменной в качестве зависимой переменной и смешанных независимых переменных наряду с наличием мультиколлинеарности - PullRequest
0 голосов
/ 08 сентября 2018

Итак, у меня есть данные компании, которая сталкивается с высоким уровнем отсева. Поэтому я пытаюсь выяснить существенные переменные, от которых зависит истощение. Для этого я сделал логистическую регрессию с коэффициентом истощения в качестве зависимой переменной. Но значения p для всех них оказываются около 1. (Я думаю, это из-за мультиколлинеарности. Для этого я проверил мультиколлинеарность с матрицей корреляции и также удалил некоторую переменную, но все же значения p равны нулю. Я также сделал VIF для выбора переменных со значениями меньше 10, но даже тогда значения p модели составляют около 1.)

Пожалуйста, помогите мне с этим. (Я проверил, являются ли категориальные переменные «факторами») enter image description here

    fit1<-glm(Attrition~Age+BusinessTravel+Distance.From.Home+Education.Field+Gender+
 Job.Satisfaction+Marital.Status+Over.Time+
Percent.Salary.Hike+Performance.Rating+Relationship.Satisfaction+
Total.Working.Years+Years.At.Company+Years.In.Current.Role+Years.Since.Last.Promotion+Years.With.Curr.Manager, family = "binomial")
...