Я заинтересован в исследовании нелинейного временного тренда в наборе данных, и поэтому я хотел бы использовать пакет R mgcv
, чтобы соответствовать следующей GAM:
model1 <- gam(Variable ~ s(Date, by = Site.Factor), data = data)
, где Variable
представляет собой интересующую непрерывную переменную, Site.Factor
представляет собой фактор с двумя уровнями, а Date
представляет собой непрерывную переменную.
Я читал, что знаю, что из-за включения коэффициента по в функцию сглаживания,Различия в средствах двух уровней факторов не учитываются.Поэтому я должен включить Site.Factor
в качестве параметрического термина следующим образом:
model2 <- gam(Variable ~ Site.Factor + s(Date, by = Site.Factor), data = data)
Однако, хотя я могу ожидать, что влияние Site.Factor
на сглаживание будет значительным, я не ожидаю, что средства каждогоУровень фактора должен быть значительным.Нужно ли мне включать коэффициент отдельно в модель, как в model1
, или model2
будет хорошо?