Я работаю с практическим листом по этой ссылке: http://www.statslab.cam.ac.uk/~rds37/teaching/statistical_modelling/Practical6.pdf
В упражнении 3 указано, что для проверки, насколько близорукость матери и близорукость отца одинаково значимы, мы должны создать новую переменную
mumORdadMyopic <- (dadMyopic == "Yes") | (mumMyopic == "Yes")
, а затем подгоните модель к переменным dadMyopic, mumORdadMyopic.Используя предыдущие упражнения в качестве руководства, мы затем выполнили бы
data_1 <- myopic %>% dplyr::select(-compH, -TVHR)
data_2 <- myopic %>% dplyr::select(-compH, -TVHR, -mumMyopic) %>% cbind(mumORdadMyopic))
model_1 <- glm(myopic ~ ., data = data_1, family = binomial)
model_2 <- glm(myopic ~ ., data = data_2, family = binomial)
anova(model_1, model_2, test = "LR")
Мой вопрос таков:
С целью проверки того, являются ли mumMyopic и dadMyopic одинаково значимыми переменными, почемувыше того, что мы хотим выполнить?Я бы подумал, что мы хотели бы подогнать одну модель без mumMyopic и одну без dadMyopic и сравнить производительность моделей.
newdata_1 <- myopic %>% dplyr::select(-compH, -TVHR, -dadMyopic)
newdata_2 <- myopic %>% dplyr::select(-compH, -TVHR, -mumMyopic)
newmodel_1 <- glm(myopic ~ ., data = newdata_1, family = binomial)
newmodel_2 <- glm(myopic ~ ., data = newdata_2, family = binomial)
anova(newodel_1, newmodel_2, test = "LR")
, где, если newmodel_1 и newmodel_2 значительно различаются (в статистическом смысле), мы могли бы отвергнуть гипотезу о том, что муммопия и папа-миопия имеют одну и ту же прогностическую силу.
Может кто-нибудь объяснить, почему мой предложенный подход не достигает того, чего я хочу, и почему намеченный подход упражнения является правильным?
Спасибо!