Я удаляю выбросы из кадра данных (комби).
Как мне а) подтвердить, что точки данных удалены из исходного кадра данных (combi), а не только временный кадр данных (numeric_train) и b) узнать, сколько точек данных было удалено 1b.всего 2б.на переменную?
Я сначала отфильтровал числовые переменные.
numeric_train <- Filter(is.numeric, subset(combi, dataset == "train"))
(Не опубликовано: код для extreme.threshold.upper и extreme.threshold.lower, но в основном это 3 * диапазон IQR +/ - верхний и нижний квартили)
экстремальные выбросы:
extreme_outliers <- which(numeric_train > extreme.threshold.upper |
numeric_train < extreme.threshold.lower)
str(extreme_outliers)
Удалить экстремальные выбросы:
numeric_train <- numeric_train[-extreme_outliers]
Теперь я хотел бы определить, были ли правильно удалены выбросыот комби и сколько (всего и по переменной).Как я могу это сделать?