Я хочу рассчитать показатели распространенности для подгрупп и скорректировать для таких переменных, как пол, возраст и конфузант, используя регрессию Пуассона. Вот похожий вопрос с хорошим ответом, но я не могу адаптировать код под свои нужды. Смертность .
На этом снимке экрана Excel показана формула для показателя распространенности.
Пример набора данных с важными переменными:
set.seed(1)
n <- 5000
data <-
data.frame(
exposed = sample(0:1, n, replace = TRUE, prob = c(.25, .1)),
outcome = sample(0:1, n, replace = TRUE, prob = c(.95, .05)),
confounder= sample(0:1, n, replace = TRUE, prob = c(.2, .8)),
sex = sample(c("Male", "Female"), n, replace = TRUE),
age = sample(20:80, n, replace = TRUE),
group = sample(1:5, n, replace = TRUE)
)
В конце я хочу получить список, подобный этому:
Group 1 - count exposed/without outcome - count exposed/with outcome - prevalence rate - confidence intervall - p-value
Group 2 - count exposed/without outcome - ...
Я был бы очень рад некоторой помощи.