Я пытаюсь улучшить соответствие данных с моделью GAM.Я установил разные модели, и при проверке моделей я всегда нахожу одно и то же:
Из того, что я понимаю в моделях GAM, количество узлов недостаточно, и его следует увеличить.Проблема в том, что независимо от того, насколько увеличится k, значение p все еще очень мало.
Я что-то не так делаю или это разумно в этих данных?
Family: gaussian
Link function: identity
Formula:
output ~ s(V1, bs = "cs", k = -1) +
s(V2, bs = "cs", k = -1) + s(V3,
bs = "cs", k = -1) + s(V3, bs = "cs", k = -1) +
s(V4, bs = "cs", k = -1) + s(V5,
bs = "cs", k = -1) + s(V6, bs = "cs", k = -1) +
s(V7, bs = "cs", k = -1) + Year + Code +
Adi + PTC + Extr
Parametric coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 3.337146 0.016881 197.681 < 2e-16 ***
Year2013 0.119360 0.009884 12.076 < 2e-16 ***
Year2014 0.114468 0.010679 10.719 < 2e-16 ***
Year2015 0.091293 0.011546 7.907 3.42e-15 ***
Year2016 0.126597 0.010923 11.590 < 2e-16 ***
Year2017 0.155828 0.012621 12.347 < 2e-16 ***
Year2018 0.183352 0.012723 14.411 < 2e-16 ***
CodeMQ -0.167870 0.007628 -22.006 < 2e-16 ***
CodeGR -0.182815 0.030010 -6.092 1.23e-09 ***
CodeCH -0.248863 0.016057 -15.498 < 2e-16 ***
CodeES -0.222465 0.022174 -10.033 < 2e-16 ***
AdiNew -0.001867 0.007015 -0.266 0.7901
PTCYes 0.036107 0.008573 4.212 2.59e-05 ***
ExtrOPTION2. 0.030835 0.016972 1.817 0.0693 .
ExtrOPTION3 -0.034393 0.015785 -2.179 0.0294 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Approximate significance of smooth terms:
edf Ref.df F p-value
s(V1) 4.282 9 5.286 7.93e-11 ***
s(V2) 4.926 9 2.733 4.18e-05 ***
s(V3) 3.768 9 0.837 0.0847 .
s(V4) 3.966 9 529.678 < 2e-16 ***
s(V5) 2.206 9 0.607 0.0569 .
s(V6) 3.957 9 3.298 6.83e-07 ***
s(V7) 1.785 9 0.688 0.0315 *
s(V8) 4.861 9 1.226 0.0336 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
R-sq.(adj) = 0.855 Deviance explained = 85.7%
GCV = 0.020305 Scale est. = 0.020072 n = 3895
Method: GCV Optimizer: magic
Smoothing parameter selection converged after 13 iterations.
The RMS GCV score gradient at convergence was 2.172777e-07 .
The Hessian was not positive definite.
Model rank = 87 / 87
Basis dimension (k) checking results. Low p-value (k-index<1) may
indicate that k is too low, especially if edf is close to k'.
k' edf k-index p-value
s(V1) 9.00 4.28 0.81 <2e-16 ***
s(V2) 9.00 4.93 0.85 <2e-16 ***
s(V3) 9.00 3.77 0.81 <2e-16 ***
s(V4) 9.00 3.97 0.82 <2e-16 ***
s(V5) 9.00 2.21 0.82 <2e-16 ***
s(V6) 9.00 3.96 0.80 <2e-16 ***
s(V7) 9.00 1.78 0.85 <2e-16 ***
s(V8) 9.00 4.86 0.86 <2e-16 ***