Тестирование относительной значимости переменных в glm - PullRequest
0 голосов
/ 23 сентября 2018

Я работаю с практическим листом по этой ссылке: http://www.statslab.cam.ac.uk/~rds37/teaching/statistical_modelling/Practical6.pdf

В упражнении 3 указано, что для проверки, насколько близорукость матери и близорукость отца одинаково значимы, мы должны создать новую переменную

mumORdadMyopic <- (dadMyopic == "Yes") | (mumMyopic == "Yes")

, а затем подгоните модель к переменным dadMyopic, mumORdadMyopic.Используя предыдущие упражнения в качестве руководства, мы затем выполнили бы

data_1 <- myopic %>% dplyr::select(-compH, -TVHR)
data_2 <- myopic %>% dplyr::select(-compH, -TVHR, -mumMyopic) %>% cbind(mumORdadMyopic))

model_1 <- glm(myopic ~ ., data = data_1, family = binomial)
model_2 <- glm(myopic ~ ., data = data_2, family = binomial)

anova(model_1, model_2, test = "LR")

Мой вопрос таков:

С целью проверки того, являются ли mumMyopic и dadMyopic одинаково значимыми переменными, почемувыше того, что мы хотим выполнить?Я бы подумал, что мы хотели бы подогнать одну модель без mumMyopic и одну без dadMyopic и сравнить производительность моделей.

newdata_1 <- myopic %>% dplyr::select(-compH, -TVHR, -dadMyopic)
newdata_2 <- myopic %>% dplyr::select(-compH, -TVHR, -mumMyopic)

newmodel_1 <- glm(myopic ~ ., data = newdata_1, family = binomial)
newmodel_2 <- glm(myopic ~ ., data = newdata_2, family = binomial)

anova(newodel_1, newmodel_2, test = "LR")

, где, если newmodel_1 и newmodel_2 значительно различаются (в статистическом смысле), мы могли бы отвергнуть гипотезу о том, что муммопия и папа-миопия имеют одну и ту же прогностическую силу.

Может кто-нибудь объяснить, почему мой предложенный подход не достигает того, чего я хочу, и почему намеченный подход упражнения является правильным?

Спасибо!

...