Текущий фрейм данных состоит из числовых значений.Я определяю выбросы в столбце данных по столбцу за столбцом. Могу ли я сразу определить выбросы в столбце и удалить их за один раз?Сейчас я меняю значения на NA
Мой код:
quantiles<-tapply(var1,names,quantile)
minq <- sapply(names, function(x) quantiles[[x]]["25%"])
maxq <- sapply(names, function(x) quantiles[[x]]["75%"])
var1[var1<minq | var1>maxq] <- NA
Данные.
Данные, опубликованные ФП в комментарии вdput
формат.
df1 <-
structure(list(Var1 = c(100.2, 110, 200, 456, 120000),
var2 = c(NA, 4545L, 45465L, 44422L, 250000L),
var3 = c(NA, 210000L, 91500L, 215000L, 250000L),
var4 = c(0.983, 0.44, 0.983, 0.78, 2.23)),
class = "data.frame", row.names = c(NA, -5L))