Я работаю с набором данных, содержащим 93 столбца, и многие из них имеют большой процент пропущенных значений.Я ищу способ упростить проверку каждого столбца на процент пропущенных значений и затем вернуть список имен этих переменных выше этого порога для включения в новый набор данных.
У меня есть функция для проверкидля пропущенных значений и вернуть процент пропущенных:
#check for missing data
pMiss <- function(x) {
sum(is.na(x))/length(x)*100
}
#percent of data missing per column
x <- apply(dt2,2,pMiss)
Как я могу получить все имена [из x] столбцов, где процент пропущенных значений составляет менее 20%?Я хотел бы получить эти имена в виде списка, который я могу вставить в новый набор данных, поэтому мне не нужно вручную копировать и вставлять каждое имя из x.
Заранее спасибо.