Я пытаюсь сделать упражнения о смертности, связанной с температурой. Я хочу построить кривую воздействия-отклика, определить порог температуры и оценить относительный риск смертности выше этого порога. Я работаю с ежедневными данными. Я использую модель GLM (пакеты: nlme, сплайны) и пакет DLNM для построения кросс-базисной матрицы для температуры и лагов:
Date AvgTemp MaxTemp MinTemp AllCauseMort AvgPM10 AvgO3
<dttm> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
1 1995-01-01 00:00:00 5 7.4 3.4 7 78 25.3
2 1995-01-02 00:00:00 4.6 7.1 2.6 8 95 24
3 1995-01-03 00:00:00 8.6 10.6 5.2 9 43.5 24.7
4 1995-01-04 00:00:00 8.7 11 8.4 6 32 25
5 1995-01-05 00:00:00 8.5 10.6 5.6 8 48.9 28.3
6 1995-01-06 00:00:00 8 9.9 1 8 41.9 28.2
#
model<-glm(daily_mortality~cb+ ns(time,df=7)+dow, family=quasipoisson, data)
time=1:length(data$date)` to control for long-term and seasonal trends
dow<-as.factor(weekdays(data$date))
cb<-crossbasis(data$Temp,lag=21,argvar=list(knots= equalknots(data$Temp, df=5)), arglag=list(knots=logknots(21,3,df=4)))
pred<- crosspred(cb, model, cen=median(data$AvgTemp), cumul=TRUE)
plot()
plot(pred, "overall", ylab="cumulative RR", xlab="Temp", ylim=c(0.5,4),col=2,lwd=2)
pred$cumRRfit
pred$allRRfit
Одна из моих проблем состоит в том, что я оцениваю огромные allRRfit и cumRRfit, которые я думаю, что это неправильно.
Может кто-нибудь догадаться, почему или предложить мне книгу / книгу для чтения (я прочитал все о Гаспаррини)?