Моделирование показателей распространенности с использованием регрессии Пуассона - PullRequest
0 голосов
/ 27 января 2020

Я хочу рассчитать показатели распространенности для подгрупп и скорректировать для таких переменных, как пол, возраст и конфузант, используя регрессию Пуассона. Вот похожий вопрос с хорошим ответом, но я не могу адаптировать код под свои нужды. Смертность .

На этом снимке экрана Excel показана формула для показателя распространенности.

Formula for prevalence rate

Пример набора данных с важными переменными:

set.seed(1)
n <- 5000
data <- 
  data.frame(
    exposed = sample(0:1, n, replace = TRUE, prob = c(.25, .1)),
    outcome = sample(0:1, n, replace = TRUE, prob = c(.95, .05)),
    confounder= sample(0:1, n, replace = TRUE, prob = c(.2, .8)),
    sex = sample(c("Male", "Female"), n, replace = TRUE),
    age = sample(20:80, n, replace = TRUE),
    group = sample(1:5, n, replace = TRUE)
  )

В конце я хочу получить список, подобный этому:

Group 1 - count exposed/without outcome - count exposed/with outcome - prevalence rate - confidence intervall - p-value
Group 2 - count exposed/without outcome - ...

Я был бы очень рад некоторой помощи.

...