Совпадение в параметрах c в терминах GAM в R с mgcv - PullRequest
2 голосов
/ 28 апреля 2020

У меня есть модель GAM (ниже), где SST_mean и NAO являются числовыми значениями, а цикл и регион являются категориальными факторами. Я проверил на совпадение, используя функцию совпадения в mgcv.

m2 <- gam(Strandings ~ s(SST_mean) + s(NAO, bs="re") + Cycle + Region, 
      family=poisson, data=DAT_ST, method = "REML")

Первоначальные результаты, приведенные ниже, имели довольно высокие значения, свидетельствующие о наличии параллелизма в модели.

> concurvity(m2, full = TRUE)
                     para     s(SST_mean)  s(NAO)
          worst    0.8944583  0.7532177   0.7131497
          observed 0.8944583  0.5784295   0.7131497
          estimate 0.8944583  0.5309899   0.7131497

Я запустил парные сравнения, и похоже, что проблемы с параллелизмом фактически связаны между параметрами. c термины не между сглаженными терминами или между сглаженными терминами и параметрами c

 > concurvity(m2, full = FALSE)
 $worst
                para        s(SST_mean)    s(NAO)
 para        1.000000e+00   1.736827e-25   0.001064966
 s(SST_mean) 1.746022e-25   1.000000e+00   0.351366528
 s(NAO)      1.064966e-03   3.513665e-01   1.000000000

Есть ли для этого какая-либо причина, и является ли это проблемой для моих моделей. Или из-за того, что параметрические параметры являются категоричными, этого следует ожидать по какой-то причине? Кто-то, кого я читал, что выше 0,8 указывает на параллелизм, который следует учитывать, но я не могу найти какие-либо конкретные пороги c в литературе. Есть ли какие-либо рекомендации, которые люди могли бы порекомендовать, пожалуйста?

...