Значимые переменные для регрессии Logisti c в R - PullRequest
0 голосов
/ 07 марта 2020

Я все еще новичок в R и все еще борюсь. Я пытаюсь выполнить регрессию logisti c, используя категориальную и непрерывную переменную, и я должен выбрать правильную переменную для моей модели. Есть 27 переменных и 8000 наблюдений.

Я просмотрел несколько статей в Интернете, включая пошаговую регрессию ИИ C, и все, что я делаю, - это запутываю себя, чем больше. Мне также сказали выбрать мои переменные из матрицы корреляции, но когда я делаю корреляцию, я не вижу корреляции, особенно с категориальной переменной. Я также пытаюсь уместить всю модель и получаю некоторые переменные с p-значением менее 0,5. Это код:

d4 <- d3[,c('SW','MOI','YOI','DOI_CMC','RMOB','RYOB','RDOB_CMC',
            'RCA','Region','TPR','DPR','NV','HEL','Has_Radio','Has_TV',
            'Religion','WI','MOFB','YOB','DOB_CMC','DOFB_CMC','AOR','MTFBI',
            'DSOUOM_CMC','RW','RH','RBMI')]
cor(d4)
d5 <- cor(d4)
round(cor(d4),2)

Когда я выбираю значимые переменные и пытаюсь применить регрессию logisti c, все значение p будет в диапазоне от 0,9 до 1. См. Код:

d3 <- lm(TPR ~ SW + MOI + RMOB + RYOB + RCA + Region + TPR + DPR +
               NV + HEL + Has_Radio + Has_TV + Religion + WI + MOFB +
               YOB + DOB_CMC + DOFB_CMC + AOR + MTFBI + DSOUOM_CMC + 
               RW + RH + RBMI,
         data = d3, family = "binomial") 
summary(d3) 

Мне нужна помощь с этим, пожалуйста! Вот образец d3 d3 Sample

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...