Я студент, который не имеет никаких предварительных знаний в области кодирования, но я беру модуль, требующий RStudio, и теперь я борюсь.
У меня есть задание, которое требовало от нас изученияметоды работы с отсутствующими данными в наборе обучающих данных и наборе тестовых данных (несколько строк и несколько переменных), а затем создание линейной модели lm
с использованием обучающего набора.Затем используйте predict
с указанным lm
с новыми данными = тестовыми данными, чтобы увидеть результаты.Мне поручили узнать, как использовать MICE
для выполнения этого задания, но я зашел в тупик.
В своей попытке я попытался восполнить недостающие данные набора данных тренировки через MICE
с моим подходом следующим образом:
train = read.csv("Train_Data.csv", na.strings=c("","NA"))
missingtraindata = mice(train, m=5, maxit = 5, method = 'pmm')
model = with(missingtraindata, lm(LOS~.- PatientID, data = train))
miceresults = pool(model)
summary(miceresults)
Затем я попытался использовать predict()
, но он не работает, потому что он говорит, что mira / mipo не работает с predict()
.Я вообще не знаю, что это значит.
Честно говоря, я понятия не имею, что делает какой-либо из этих кодов, я просто пытался применить любую доступную информацию из заметок, которые у меня есть относительно MICE
.Я не знаю, правильно ли вы используете MICE для заполнения недостающих данных, но я буквально потратил весь день на исследования и попытки, но это не помогло.Пожалуйста, помогите!