Ошибка при поиске выбросов для набора данных алмазов - PullRequest
0 голосов
/ 07 февраля 2019

для приведенного ниже кода, я получаю ошибку:

boxplot(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table, diamonds$x,
        diamonds$y, diamonds$z)
boxplot(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table, diamonds$x, 
        diamonds$y, diamonds$z)$out
outliers <- boxplot(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table, diamonds$x, 
                    diamonds$y, diamonds$z, plot = FALSE)$out diamonds[which(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table, diamonds$x, diamonds$y, diamonds$z %in% outliers),]
Newdata <- diamonds[-which(diamonds$carat, diamonds$cut, diamonds$depth, diamonds$table,
                           diamonds$x, diamonds$y, diamonds$z %in% outliers),] 

ошибка составляет

Ошибка, в которой (алмазы $ карат, алмазы $ глубина, алмазы $ таблица,алмазы $ x,: неиспользованные аргументы (алмазы $ x, алмазы $ y, алмазы $ z% в% выбросов)

1 Ответ

0 голосов
/ 07 февраля 2019

Вот пример решения: сначала мы выбираем интересующие нас столбцы

subset_df<diamonds[,which(names(diamonds)%in%c("carat","cut","depth","x","y","z","table"))]

Далее мы определяем, что определяет выброс.Я установил это значение на любое значение больше 5.

outliers<-subset_df[which(subset_df$z>=5),]  

Наконец, мы создаем наш блок-график.

boxplot(outliers)

Non-Outliers: я бы пошел с ggplot2 по причинампредпочтения.

non_outliers<-subset_df[which(subset_df$z<5),]
boxplot(non_outliers)

ПРИМЕЧАНИЕ:

Учитывая, что данные взяты из ggplot2, вы можете рассмотреть dplyr и ggplot2 для "плавный рабочий процесс (основанный на мнении).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...