R: избегая повторения - PullRequest
       4

R: избегая повторения

1 голос
/ 31 марта 2019

Я пытаюсь избежать повторения.

Мой код:

df_purged <- subset(df, 
  A1 < 1.5 * IQR(A1) | A1 > 1.5 * IQR(A1) &
  A4 < 1.5 * IQR(A4) | A4 > 1.5 * IQR(A4) &
  A5 < 1.5 * IQR(A5) | A5 > 1.5 * IQR(A5) &
  A8 < 1.5 * IQR(A8) | A8 > 1.5 * IQR(A8) &
  A10 < 1.5 * IQR(A10) | A10 > 1.5 * IQR(A10))
df_purged

То, что я пробовал (не работает, не может реализовать and операторов):

df_purgedd<- subset(df, for(col in c (A1,A4,A5,A8,A10)){[col] < 1.5 * IQR([col]) | A1 > 1.5 * IQR([col])})
df_purgedd

Заранее спасибо

1 Ответ

1 голос
/ 31 марта 2019

Мы можем перебрать интересующие столбцы и применить функцию, затем Reduce ее к одному логическому вектору с &

# create a function based on the logic
f1 <- function(x) x < 1.5 * IQR(x) | x > 1. 5 * IQR(x)
# loop through the columns with lapply, apply the 'f1' 
# and Reduce it to single logical vector
nm1 <- paste0("A", c(1, 4, 5, 8, 10))
i1 <- Reduce(`&`, lapply(df[nm1], f1))
# subset the rows
out <- subset(df, i1)

Или другой вариант после создания функции - использовать filter_at

library(dplyr)
df %>% 
    filter_at(vars(nm1), all_vars(f1))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...