Когда я запускаю логистическую регрессию для набора данных автомобилей:
carlogistic.fit4 <- glm(as.factor(Mpg01) ~ Weight+Year+Origin, data=carslogic, family="binomial")
summary(carlogistic.fit4)
Я получаю следующий вывод:
Вызов:
glm (формула = as.factor (Mpg01) ~ Вес + Год + Происхождение, семейство = "Бином",
данные = карлогические)
Остатки отклонения:
Мин 1Q Медиана 3Q Макс
-2.29189 -0.10014 -0.00078 0.19699 2.60606
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.697e+01 5.226e+00 -5.161 2.45e-07 ***
Weight -6.006e-03 7.763e-04 -7.737 1.02e-14 ***
Year 5.677e-01 8.440e-02 6.726 1.75e-11 ***
OriginGerman 1.256e+00 5.172e-01 2.428 0.0152 *
OriginJapanese 3.250e-01 5.462e-01 0.595 0.5519
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 549.79 on 396 degrees of freedom
Residual deviance: 151.06 on 392 degrees of freedom
AIC: 161.06
Однако, если вы заметите, что значение p для автомобилей японского происхождения превышает 0,05 и, следовательно, является незначительным. Я хочу удалить это из модели, однако заголовок столбца - это Origin, как вы видите в исходном коде. Как исключить японское происхождение именно из модели?