Прогнозирование с использованием пуассоновской регрессии - PullRequest
0 голосов
/ 27 апреля 2020

Мне интересно, как я могу предсказать результаты за период 2018: 2030, используя мои данные, которые включают в себя такие переменные, как ГОД, ВОЗРАСТ, ЖЕНЩИНА и РАС.

Я использую настройку svydesign для этого прогноза, и ниже я получаю точные результаты, просто выполняя простые таблицы.


hiptotal1 <- svyby(~hipPJI, ~YEAR, design = mydesign, FUN = svytotal, vartype = "ci")

   YEAR    hipPJI      ci_l      ci_u
2015 2015 10580.001  9861.132 11298.869
2016 2016 11390.000 10601.341 12178.659
2017 2017 11800.003 10961.674 12638.332

Затем я пытаюсь создать модель прогнозирования, и я определенно делаю что-то неправильно, но я не уверен, что именно. Мой код:

AdjPoissonHip <- svyglm(hipPJI ~ YEAR, family = poisson(), design = mydesign)
years <- data.frame(YEAR = 2018:2030)
predictHip <- predict(AdjPoissonHip, newdata = years, type = "response", se.fit =TRUE, interval = "predict") 

    response    SE
1  0.0082704 2e-04
2  0.0084020 2e-04
3  0.0085357 2e-04
4  0.0086715 2e-04
5  0.0088095 2e-04
6  0.0089496 3e-04
7  0.0090920 3e-04
8  0.0092367 3e-04
9  0.0093837 3e-04
10 0.0095330 4e-04
11 0.0096847 4e-04
12 0.0098388 4e-04
13 0.0099953 5e-04

Я не уверен, почему мои результаты так плохи. Я просто использую неправильную опцию для генерации своих результатов?

Вторая часть этого вопроса - хочу ли я включить AGE, FEMALE и RACE в качестве значений предикторов, но все же просто хочу посмотреть на оценки за год, но не стратифицированы по возрасту, женской и гонке, как я мог это сделать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...