Я делаю стратифицированный по времени анализ случаев заболевания, чтобы посмотреть влияние загрязнения воздуха (с разными задержками) на госпитализацию по поводу астмы на индивидуальном уровне. Я создал эту таблицу данных в R с эффектами запаздывания уже в ней.
Мой 1-й вопрос: должны ли эффекты запаздывания использоваться в одной или в отдельных моделях?
> sample.data
DAY_TYPE ID DATE HOLIDAY INFLUENZA NO2_LAG0 NO2_LAG1 NO2_LAG2 TEMP_LAG0 HUMI_LAG0
1 1 8632 2015-03-05 0 29.8 4.0 6.5 12.4 11.3 93.1
2 0 8632 2015-03-12 0 29.8 3.6 6.7 7.9 7.3 79.4
3 0 8632 2015-03-19 0 29.8 4.6 4.9 3.0 8.3 95.2
4 0 8632 2015-03-26 0 29.8 12.2 2.5 1.8 5.6 96.0
5 0 1110 2015-06-04 0 29.7 6.4 10.0 13.1 8.7 84.7
6 0 1110 2015-06-11 0 29.7 3.6 5.2 3.3 7.0 85.4
7 1 1110 2015-06-18 0 29.7 3.5 3.3 6.5 7.9 84.0
8 0 1110 2015-06-25 0 29.7 2.8 4.5 1.6 8.6 87.2
DAY_TYPE==1
равно кейс дня DAY_TYPE==0
равно контрольного дня . Контрольные дни были выбраны с того же дня недели в том же месяце.
library(survival)
# NO2 lags in one model
mod1.asthma <- clogit(DAY_TYPE ~ NO2_LAG0 + NO2_LAG1 + NO2_LAG2 + TEMP_LAG0 + HUMI_LAG0 +
HOLIDAY +INFLUENZA +strata(ID), sample.data)
# NO2 lags in separate models
mod2.asthma <- clogit(DAY_TYPE ~ NO2_LAG0 + TEMP_LAG0 + HUMI_LAG0 + HOLIDAY +INFLUENZA +strata(ID), sample.data)
mod3.asthma <- clogit(DAY_TYPE ~ NO2_LAG1 + TEMP_LAG0 + HUMI_LAG0 + HOLIDAY +INFLUENZA +strata(ID), sample.data)
mod4.asthma <- clogit(DAY_TYPE ~ NO2_LAG2 + TEMP_LAG0 + HUMI_LAG0 + HOLIDAY +INFLUENZA +strata(ID), sample.data)
Какой из них правильный?
В некоторых исследованиях рассматривались скорректированные операционные показатели для воздействия NO2 с шагом 10 мкг / м3, мой второй вопрос: как это рассчитывается?
Заранее спасибо!