Когда я использую GLMULTI для выбора признаков, «лучшая» модель включает взаимодействия, которые создают NA в сводке GLM. Я не знаю, как повторить это с MWE. Моя выборка - 500 наблюдений, и у меня есть 11 предикторов. Я использую следующие параметры:
glmulti(y ~ ., data=data,
level=2, fitfunction=glm, crit="aic", confsetsize=128,
method = "g", plotty = T, chunks = 8)
Call:
glm(formula = y ~ many xs with interactions, family = poisson, data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3320 -0.6356 -0.5151 -0.3506 4.8717
Coefficients: (2 not defined because of singularities)
Estimate Std. Error z value Pr(>|z|)
(Intercept) -1.876056 0.236441 -7.935 2.11e-15 ***
x1 0.124758 0.074982 1.664 0.096142 .
x2 -0.706902 0.526248 -1.343 0.179180
x3:x4 -2.624327 1.013763 -2.589 0.009634 **
x3:x5 1.113042 0.352948 3.154 0.001613 **
x5:x6 NA NA NA NA
x7:x8 0.602221 0.340918 1.766 0.077317 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for poisson family taken to be 1)
Null deviance: 598.72 on 499 degrees of freedom
Residual deviance: 358.95 on 479 degrees of freedom
AIC: 605.99
Number of Fisher Scoring iterations: 17
Я интерпретирую оценки коэффициента NA как результат произведения слагаемых взаимодействия всегда равными 0. Я дважды проверил, и это имело место , Другие оценки коэффициентов в моей модели работают нормально.
У меня есть три вопроса: во-первых, концептуально, почему эта функция считает, что включение оценок коэффициентов взаимодействия, которые являются NA, снижает AI C?
Во-вторых, как я могу настроить эту функцию для получения более полезных результатов?
В-третьих, почему GLMULTI показывает Crit= 1111.20315208458
, а мой сводный вывод показывает AIC: 605.99
?