Я оценил glm в R, чтобы предсказать вероятность покупки, основываясь на некоторых переменных.Среди прочего я включил:
- Пол (2 = женщина, 1 = мужчина)
- Переменная кластера (деление кластеров от 1-4)
- Пустышкадля мобильного / стационарного устройства (0 = фиксированный, 1 = мобильный)
Однако я не понимаю, как мне следует интерпретировать оценки этих трех переменных.
Я установилпеременные как факторы с кодом: DF $ variable <- factor (DF $ variable) </p>
Мои результаты следующие:
Call:
glm(formula = purchase_any ~ TP.CJ + dummymobile + Duration.CJ +
GenderID + Age + BAS_bruto_jaarinkomen + BAS_voltooide_opleiding8_resp +
democlusterclara, family = binomial(link = "logit"), data = CompletePS)
Deviance Residuals:
Min 1Q Median 3Q Max
-6.6298 -0.5163 -0.4566 -0.3719 2.6107
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.725e+00 1.318e-01 -20.683 < 2e-16 ***
TP.CJ 8.756e-04 1.575e-04 5.559 2.72e-08 ***
dummymobile1 -6.212e-01 5.452e-02 -11.394 < 2e-16 ***
Duration.CJ 2.925e-05 3.118e-06 9.380 < 2e-16 ***
GenderID2 -5.533e-02 9.292e-02 -0.595 0.55154
Age -3.596e-03 1.669e-03 -2.155 0.03113 *
BAS_bruto_jaarinkomen 1.642e-01 1.513e-02 10.851 < 2e-16 ***
BAS_voltooide_opleiding8_resp 5.829e-02 1.203e-02 4.846 1.26e-06 ***
democlusterclara2 -7.404e-02 1.052e-01 -0.704 0.48173
democlusterclara3 -2.161e-01 7.746e-02 -2.790 0.00527 **
democlusterclara4 -1.392e-01 1.081e-01 -1.288 0.19772
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 22046 on 29010 degrees of freedom
Residual deviance: 20410 on 29000 degrees of freedom
AIC: 20432
Number of Fisher Scoring iterations: 5
Мои вопросы:
Как интерпретировать dummymobile?
Как интерпретировать GenderID2?(Я знаю, что это незначительно, но я хотел бы знать, для других моделей, где это важно)
Как интерпретировать democlusterclara 2, 3 и 4?
Заранее спасибо!