Описательные данные с мышами / мышами - PullRequest
0 голосов
/ 30 апреля 2019

Я использовал мышей / мышей для многократного вливания.Я заинтересован в получении ряда описательных статистических данных для "набора данных в пуле"

Вопрос: 1) Я хочу знать% значений, которые выше определенного значения в вмененной переменной.Например, сколько случаев имеют значения выше 5 (по шкале от 0 до 10), когда все вмененные наборы данных агрегируются.Возможно ли это с данными MI?

2) Если № 1 невозможен, есть ли близкая альтернатива?

Ответы [ 2 ]

0 голосов
/ 16 мая 2019

Другим простым способом было бы создать полный набор данных «длинного формата» и просто вычислить среднее значение, медиану или пропорцию по всем вмененным наборам данных.Поскольку правила Рубина гласят, что ваша лучшая оценка - это среднее значение по всем вменениям, это должно дать вам соответствующий результат.Единственным недостатком является то, что вы не получите оценку стандартной ошибки этих статистических данных.

impL <- complete(imp,"long",include = F) # long format without the original dataset
mean(impL$x) # Mean of variable x over all datasets
sum(impL$y > 5)/length(impL$y) # proportion of variable y higher than 1 over all datasets

Обратите внимание, что если вы хотите оценить частоту (то есть количество случаев) вместо пропорции, вы получитенеобходимо разделить на количество вмененных наборов данных (например, 5)

sum(impL$y > 5)/5
0 голосов
/ 07 мая 2019

То, что вы, вероятно, сделали, выглядит примерно так:

# create imputed datasets
imp <- mice(nhanes, m = 5)
#perform lm on all imputed datasets
fit <- with(data = imp, exp = lm(bmi ~ hyp + chl))
#pool results
summary(pool(fit))

Итак, у вас есть объединенные результаты модели lm. Думаю, вы хотите знать, как выглядели вмененные данные, которые вошли в модель.

Вмененные данные фактически находятся в переменной 'imp'. С помощью imp $ imp вы получите значения, которые были рассчитаны для каждого m. Затем вы можете выполнить необходимый анализ для них.

Если вам нужны завершенные наборы данных (а не только вмененные значения), тогда вы должны выполнить

complete(imp, action ="all")

или если вам нужен только определенный завершенный набор данных m:

complete(imp, action =2)

например. Вы могли бы тогда набрать

summary(complete(imp, action =2))

для получения сводной статистики по второму вмененному набору данных.

...