Количество узлов в GAM слишком мало, но edf не близко к k ' - PullRequest
0 голосов
/ 10 мая 2019

Я пытаюсь улучшить соответствие данных с моделью GAM.Я установил разные модели, и при проверке моделей я всегда нахожу одно и то же:

Из того, что я понимаю в моделях GAM, количество узлов недостаточно, и его следует увеличить.Проблема в том, что независимо от того, насколько увеличится k, значение p все еще очень мало.

Я что-то не так делаю или это разумно в этих данных?

Family: gaussian 
Link function: identity 

Formula:
output ~ s(V1, bs = "cs", k = -1) + 
    s(V2, bs = "cs", k = -1) + s(V3, 
    bs = "cs", k = -1) + s(V3, bs = "cs", k = -1) + 
    s(V4, bs = "cs", k = -1) + s(V5, 
    bs = "cs", k = -1) + s(V6, bs = "cs", k = -1) + 
    s(V7, bs = "cs", k = -1) + Year + Code + 
    Adi + PTC + Extr

Parametric coefficients:
                       Estimate Std. Error t value Pr(>|t|)    
(Intercept)            3.337146   0.016881 197.681  < 2e-16 ***
Year2013              0.119360   0.009884  12.076  < 2e-16 ***
Year2014              0.114468   0.010679  10.719  < 2e-16 ***
Year2015              0.091293   0.011546   7.907 3.42e-15 ***
Year2016              0.126597   0.010923  11.590  < 2e-16 ***
Year2017              0.155828   0.012621  12.347  < 2e-16 ***
Year2018              0.183352   0.012723  14.411  < 2e-16 ***
CodeMQ               -0.167870   0.007628 -22.006  < 2e-16 ***
CodeGR               -0.182815   0.030010  -6.092 1.23e-09 ***
CodeCH               -0.248863   0.016057 -15.498  < 2e-16 ***
CodeES               -0.222465   0.022174 -10.033  < 2e-16 ***
AdiNew               -0.001867   0.007015  -0.266   0.7901    
PTCYes                0.036107   0.008573   4.212 2.59e-05 ***
ExtrOPTION2.          0.030835   0.016972   1.817   0.0693 .  
ExtrOPTION3          -0.034393   0.015785  -2.179   0.0294 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Approximate significance of smooth terms:
         edf Ref.df       F  p-value    
s(V1)  4.282      9   5.286 7.93e-11 ***
s(V2)  4.926      9   2.733 4.18e-05 ***
s(V3)  3.768      9   0.837   0.0847 .  
s(V4)  3.966      9 529.678  < 2e-16 ***
s(V5)  2.206      9   0.607   0.0569 .  
s(V6)  3.957      9   3.298 6.83e-07 ***
s(V7)  1.785      9   0.688   0.0315 *  
s(V8)  4.861      9   1.226   0.0336 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

R-sq.(adj) =  0.855   Deviance explained = 85.7%
GCV = 0.020305  Scale est. = 0.020072  n = 3895
Method: GCV   Optimizer: magic
Smoothing parameter selection converged after 13 iterations.
The RMS GCV score gradient at convergence was 2.172777e-07 .
The Hessian was not positive definite.
Model rank =  87 / 87 

Basis dimension (k) checking results. Low p-value (k-index<1) may
indicate that k is too low, especially if edf is close to k'.

         k'  edf k-index p-value    
s(V1)  9.00 4.28    0.81  <2e-16 ***
s(V2)  9.00 4.93    0.85  <2e-16 ***
s(V3)  9.00 3.77    0.81  <2e-16 ***
s(V4)  9.00 3.97    0.82  <2e-16 ***
s(V5)  9.00 2.21    0.82  <2e-16 ***
s(V6)  9.00 3.96    0.80  <2e-16 ***
s(V7)  9.00 1.78    0.85  <2e-16 ***
s(V8)  9.00 4.86    0.86  <2e-16 ***
...