R и SPSS возвращают разные параметры для логлинейного анализа - PullRequest
0 голосов
/ 19 апреля 2020

Я провел логлинейный анализ в R на следующих данных о поступлении выпускников.

grad_admissions <- array(data = c(39, 10, 20, 15, 11, 41, 6, 60), 
                         dim = c(2,2,2), 
                         dimnames = list("department" = c("one","two"),
                                         "gender" = c("male","female"),
                                         "admission" = c("admitted","notadmitted")))

ftable(grad_admissions, row.vars = c("department"),col.vars = c("admission","gender"))

grad_admissions.df <- as.data.frame(as.table(grad_admissions))

grad_admissions.df$gender <- factor(grad_admissions.df$gender, levels = c("female","male"))
grad_admissions.df$department <- factor(grad_admissions.df$department, levels = c("two","one"))
grad_admissions.df$admission <- factor(grad_admissions.df$admission, levels = c("admitted","notadmitted"))


mod1 <- glm(Freq ~ department * gender * admission, 
            data = grad_admissions.df, family = poisson)

summary(mod1)

Я также запустил следующий синтаксис SPSS для того же набора данных (SAV-файл здесь ).

DATASET ACTIVATE DataSet2.
WEIGHT BY Count.

GENLOG Gender Admitted Department
  /MODEL=POISSON
  /PRINT=FREQ RESID ADJRESID ZRESID DEV ESTIM CORR COV
  /PLOT=NONE
  /CRITERIA=CIN(95) ITERATE(20) CONVERGE(0.001) DELTA(.5).

Оценки параметров приведены ниже. Они похожи, но не совсем одинаковы. В выводе SPSS мужчина кодируется как 0, а женщина как 1.

Может кто-нибудь объяснить, почему они не одинаковы?

SPSS vs R output

1 Ответ

2 голосов
/ 30 апреля 2020

Попробуйте выполнить следующее:

GENLOG Department Gender Admitted
  /MODEL=POISSON
  /PRINT=FREQ RESID ADJRESID ZRESID DEV ESTIM CORR COV
  /PLOT=NONE
  /CRITERIA=CIN(95) ITERATE(20) CONVERGE(0.001) DELTA(0).

Обратите внимание на спецификацию DELTA(0) в подкоманде CRITERIA. SPSS GENLOG по умолчанию добавляет .5 к количеству ячеек для каждой ячейки в насыщенной модели, что является общим методом обработки 0 ячеек в логлинейных моделях.

...