Как использовать Survey Package в R для запуска линейной регрессии - PullRequest
1 голос
/ 04 мая 2020

Я пытаюсь проанализировать данные Национального опроса о состоянии здоровья, чтобы выяснить связь между рождением и зарплатой. Для этого мне нужно использовать пакет опроса в R, чтобы правильно учесть весовые коэффициенты, strata и т. Д. c ... Я написал код с функцией опроса, но не могу запустить регрессию, так как я мне выдается сообщение об ошибке:

"Ошибка в onestrat (x [index, drop = FALSE], кластеры [index], nPSU [index] [1],: Stratum (6001) имеет только один блок питания в этап 1 "

Я не уверен, что исправить, и надеюсь, что кто-то может помочь! Вот код, который я запустил до сих пор

nhissvy <- svydesign(id=~PSU, strata=~STRATA,
                 nest = TRUE,
                 weights=~PERWEIGHT,
                 data=NHIS1)

 summary(svyglm(adj_SALARY ~ AGE+IMMIGRANT+FEMALE+MARRIED+NEWEDUC+YEAR_2015+YEAR_2016+YEAR_2017+YEAR_2018, design = nhissvy))

Вот еще документация с CD C о том, как использовать эту функцию, если она помогает: https://www.cdc.gov/nchs/data/nhis/2016var.pdf

Спасибо!

1 Ответ

0 голосов
/ 04 мая 2020

для этой ошибки вы можете использовать наиболее консервативный вариант, перечисленный здесь

options( survey.lonely.psu = "adjust" )

, для получения более подробной информации, ознакомьтесь с регрессионными моделями и тестами ассоциации сечение http://asdfree.com/national-health-interview-survey-nhis.html

...