Как подтвердить удаление выбросов и увидеть количество удаленных точек данных? - PullRequest
0 голосов
/ 01 декабря 2018

Я удаляю выбросы из кадра данных (комби).

Как мне а) подтвердить, что точки данных удалены из исходного кадра данных (combi), а не только временный кадр данных (numeric_train) и b) узнать, сколько точек данных было удалено 1b.всего 2б.на переменную?

Я сначала отфильтровал числовые переменные.

numeric_train <- Filter(is.numeric, subset(combi, dataset == "train"))

(Не опубликовано: код для extreme.threshold.upper и extreme.threshold.lower, но в основном это 3 * диапазон IQR +/ - верхний и нижний квартили)

экстремальные выбросы:

extreme_outliers <- which(numeric_train > extreme.threshold.upper | 
numeric_train < extreme.threshold.lower)
str(extreme_outliers)

Удалить экстремальные выбросы:

numeric_train <- numeric_train[-extreme_outliers]

Теперь я хотел бы определить, были ли правильно удалены выбросыот комби и сколько (всего и по переменной).Как я могу это сделать?

...