Для примера из главы 6 Гельмана я считаю, что сначала вам нужно объединиться по преступности. Файл frisk_with_noise.dat содержит 900 наблюдений, по одной записи на этническую группу, по каждому участку, за преступление (75 * 3 * 4 = 900). Но пример выходных данных в главе 6 показывает n = 225 (75 * 3). Таким образом, расширение кода Бена чем-то вроде этого немного приблизит вас к репликации вывода:
library(arm) # for display() function
X <- read.table("frisk_with_noise.dat",skip=6,header=TRUE)
names(X)[3] <- "arrests"
X <- aggregate(cbind(stops, arrests) ~ precinct + eth, data=X, sum)
fit.1 <- glm(stops~1,family=poisson,offset=log(arrests),data=X,
subset=arrests>0)
display(fit.1)
Но, как отмечено в примечании вверху файла frisk_with_noise.dat, добавлен шум, поэтому результаты не могут быть точно воспроизведены.