df <- data.frame(replicate(10,sample(0:100,1000,rep=TRUE)))
eee <- as.data.frame(lapply(df, function(cc) cc[ sample(c(TRUE, NA), prob = c(0.85, 0.15), size = length(cc), replace = TRUE) ]))
View(eee)
Это дает мне фрейм данных с отсутствующими данными.
Если переменная в моем текущем фрейме данных содержит пропущенные значения, я хочу создать две новые переменные.Первым было двоичное «да», которого не было, или «нет», которого не было.Я хочу, чтобы вторая переменная была такой же, как и исходная, если переменная не отсутствует.Если он отсутствует, я хочу вменять среднее значение исходной переменной для моего нового столбца.
Я не уверен, как написать код, чтобы выполнить эту проверку всего набора данных вместо того, чтобы выполнять каждую переменную по отдельности.
Спасибо за помощь!