Мне интересно, как я могу предсказать результаты за период 2018: 2030, используя мои данные, которые включают в себя такие переменные, как ГОД, ВОЗРАСТ, ЖЕНЩИНА и РАС.
Я использую настройку svydesign для этого прогноза, и ниже я получаю точные результаты, просто выполняя простые таблицы.
hiptotal1 <- svyby(~hipPJI, ~YEAR, design = mydesign, FUN = svytotal, vartype = "ci")
YEAR hipPJI ci_l ci_u
2015 2015 10580.001 9861.132 11298.869
2016 2016 11390.000 10601.341 12178.659
2017 2017 11800.003 10961.674 12638.332
Затем я пытаюсь создать модель прогнозирования, и я определенно делаю что-то неправильно, но я не уверен, что именно. Мой код:
AdjPoissonHip <- svyglm(hipPJI ~ YEAR, family = poisson(), design = mydesign)
years <- data.frame(YEAR = 2018:2030)
predictHip <- predict(AdjPoissonHip, newdata = years, type = "response", se.fit =TRUE, interval = "predict")
response SE
1 0.0082704 2e-04
2 0.0084020 2e-04
3 0.0085357 2e-04
4 0.0086715 2e-04
5 0.0088095 2e-04
6 0.0089496 3e-04
7 0.0090920 3e-04
8 0.0092367 3e-04
9 0.0093837 3e-04
10 0.0095330 4e-04
11 0.0096847 4e-04
12 0.0098388 4e-04
13 0.0099953 5e-04
Я не уверен, почему мои результаты так плохи. Я просто использую неправильную опцию для генерации своих результатов?
Вторая часть этого вопроса - хочу ли я включить AGE, FEMALE и RACE в качестве значений предикторов, но все же просто хочу посмотреть на оценки за год, но не стратифицированы по возрасту, женской и гонке, как я мог это сделать?