Спецификатор пространства имен в пакете gam не работает - PullRequest
2 голосов
/ 04 июня 2019

Я не понимаю, почему две приведенные ниже модели игр дают разные результаты.Единственное отличие состоит в том, что в одной из моделей я добавил спецификатор пространства имен gam:: перед функциями gam и s.

Я хочу сделать это, потому что я изучаю различия между запуском функции gamв пакете gam и в пакете mgcv.

library(ISLR)  
library(gam) 
gam.m3 <- gam::gam(wage ~ gam::s(year,4) + gam::s(age,5) + education,data=Wage) 
gam.m3.orig <- gam(wage ~ s(year,4) + s(age,5) + education, data=Wage)

#Coefficients are different
coef(gam.m3)[1]; coef(gam.m3.orig)[1] 

#Models are different
gam.m3$df.residual; gam.m3.orig$df.residual

Вот вывод.Кажется, что коэффициенты и степени свободы не должны быть разными;на самом деле две модели должны быть абсолютно одинаковыми.Но они разные, и я не понимаю, почему.Любые предложения приветствуются, я сейчас растерялся.

> library(ISLR)  
> library(gam) 
Loading required package: splines
Loading required package: foreach
Loaded gam 1.16

> gam.m3 <- gam::gam(wage ~ gam::s(year,4) + gam::s(age,5) + education,        data=Wage) 
Warning message:
In model.matrix.default(mt, mf, contrasts) :
  non-list contrasts argument ignored
> gam.m3.orig <- gam(wage ~ s(year,4) + s(age,5) + education, data=Wage)
Warning message:
In model.matrix.default(mt, mf, contrasts) :
  non-list contrasts argument ignored
> 
> #Coefficients are different
> coef(gam.m3)[1]; coef(gam.m3.orig)[1] 
(Intercept) 
  -2058.077 
(Intercept) 
  -2339.364 
> 
> #Models are different
> gam.m3$df.residual; gam.m3.orig$df.residual
[1] 2993
[1] 2986

1 Ответ

3 голосов
/ 07 июня 2019

gam вызывает gam.fit и gam.fit имеет специальный код для обработки сглаживателей. Этот код работает правильно только в том случае, если в атрибуте «rules» model.frame они правильно указаны в атрибуте «specials». В противном случае сглаживатели обрабатываются как любая другая функция, которая, по-видимому, дает другой результат. Если вы хотите узнать, как именно сглаживатели обрабатываются по-разному, вам нужно детально изучить исходный код gam.fit.

По сути, это показывает принципиальную разницу между вашими двумя вызовами на gam:

gam.smoothers()$slist
#[1] "s"      "lo"     "random"

attr(terms(wage ~ s(year,4) + s(age,5) + education, 
           specials = gam.smoothers()$slist), "specials")
#$s
#[1] 2 3
#
#$lo
#NULL
#
#$random
#NULL

attr(terms(wage ~  gam::s(year,4) + gam::s(age,5) + education, 
           specials = gam.smoothers()$slist), "specials")
#$s
#NULL
#
#$lo
#NULL
#
#$random
#NULL

Зачем вам нужно использовать gam::s? Вызов gam::gam должен быть достаточным для обеспечения вызова правильной сглаживающей функции (через поиск в пространстве имен):

gam::gam(wage ~ s(year,4) + s(age,5) + education,data=Wage)  

Edit:

ОК, mgcv::s фактически маскирует gam::s в пути поиска. Один из подходов к решению этой проблемы можно найти там .

...