Постобработка факторных / категориальных переменных - PullRequest
0 голосов
/ 19 марта 2020

Я выполняю многократное вменение некоторых данных, используя пакет 'mice'. Некоторые из вмененных переменных являются комбинациями других переменных, таких как индекс массы тела (bmi). Правильный способ вписать bmi - это вменять вес и рост, а затем при последующей обработке вычислить bmi из веса и роста. Это довольно просто, например, в следующем примере:

ini <- mice(boys, maxit=0)
meth<- ini$meth
pred <- ini$pred
pred
meth["bmi"]<- "~ I(wgt/(hgt/100)^2)"
imp.path <- mice(boys, meth=meth, pred=pred, seed=123)

Пример взят из https://www.gerkovink.com/miceVignettes/Passive_Post_processing/Passive_imputation_post_processing.html

Непрерывные переменные, которые являются функциями других переменных, прямо вперед.

Мой вопрос: Как я могу постобработать переменные, которые являются факторными переменными с одним или несколькими уровнями?

Допустим, у меня есть переменная, измеряющая потребление алкоголя, с 8 уровней с указанием суммы за месяц / неделю / день. Отсутствующие данные для этой переменной могут быть вменены. Но, скажем, мой исследовательский вопрос требует дихотомической версии этой переменной, например, «еженедельное потребление» и «не еженедельное потребление». Как мне сделать это в R? Я предполагаю, что вменение дихотомической версии потребления алкоголя считается плохой практикой (потеря информации и т. Д. c.).

...