У меня есть несколько вопросов относительно полезности количества многократно вмененных наборов данных "m". Я понял, что мыши будут повторять процесс вменения пропущенных значений в наборе данных m раз.
1) Рассматривают ли мыши вменение предыдущего шага и, таким образом, каждый шаг приближается к возможной конвергенции или каждый шаг полностью независим друг от друга?
2) Если каждый шаг не зависит друг от друга, какой смысл иметь несколько вмененных наборов данных для целей вменения?
В статье, объясняющей мышей, есть схема, показывающая несколько шагов вменения
Я полагаю, что чем больше у нас вмененных данных, тем лучше, когда мы хотим объединить результаты, однако шаг результатов анализа подразумевает создание прогностической модели, которая может быть:
#build predictive model
fit <- with(data = imp, lm(y ~ x + z))
Что произойдет, если в моем наборе данных у меня нет прогнозирующего столбца или меток? Действительно, мой набор данных содержит измерения геномики, и все они независимы. Как я могу объединить результаты или объединить m вмененных наборов данных, не пройдя этап прогнозирования?
Best
Babas