У меня есть модель GAM (ниже), где SST_mean и NAO являются числовыми значениями, а цикл и регион являются категориальными факторами. Я проверил на совпадение, используя функцию совпадения в mgcv.
m2 <- gam(Strandings ~ s(SST_mean) + s(NAO, bs="re") + Cycle + Region,
family=poisson, data=DAT_ST, method = "REML")
Первоначальные результаты, приведенные ниже, имели довольно высокие значения, свидетельствующие о наличии параллелизма в модели.
> concurvity(m2, full = TRUE)
para s(SST_mean) s(NAO)
worst 0.8944583 0.7532177 0.7131497
observed 0.8944583 0.5784295 0.7131497
estimate 0.8944583 0.5309899 0.7131497
Я запустил парные сравнения, и похоже, что проблемы с параллелизмом фактически связаны между параметрами. c термины не между сглаженными терминами или между сглаженными терминами и параметрами c
> concurvity(m2, full = FALSE)
$worst
para s(SST_mean) s(NAO)
para 1.000000e+00 1.736827e-25 0.001064966
s(SST_mean) 1.746022e-25 1.000000e+00 0.351366528
s(NAO) 1.064966e-03 3.513665e-01 1.000000000
Есть ли для этого какая-либо причина, и является ли это проблемой для моих моделей. Или из-за того, что параметрические параметры являются категоричными, этого следует ожидать по какой-то причине? Кто-то, кого я читал, что выше 0,8 указывает на параллелизм, который следует учитывать, но я не могу найти какие-либо конкретные пороги c в литературе. Есть ли какие-либо рекомендации, которые люди могли бы порекомендовать, пожалуйста?