Оцените различные логические условия из строки для каждой строки - PullRequest
6 голосов
/ 23 апреля 2019

У меня есть data.frame, как это:

  value     condition
1  0.46   value > 0.5
2  0.96 value == 0.79
3  0.45 value <= 0.65
4  0.68 value == 0.88
5  0.57   value < 0.9
6  0.10  value > 0.01
7  0.90  value >= 0.6
8  0.25  value < 0.91
9  0.04   value > 0.2

structure(list(value = c(0.46, 0.96, 0.45, 0.68, 0.57, 0.1, 0.9, 
0.25, 0.04), condition = c("value > 0.5", "value == 0.79", "value <= 0.65", 
"value == 0.88", "value < 0.9", "value > 0.01", "value >= 0.6", 
"value < 0.91", "value > 0.2")), class = "data.frame", row.names = c(NA, 
-9L))

Я хотел бы оценить строки в столбце condition для каждой строки.

Таким образом, результат будет выглядеть следующим образом.

  value     condition  goal
1  0.46   value > 0.5 FALSE
2  0.96 value == 0.79 FALSE
3  0.45 value <= 0.65  TRUE
4  0.68 value == 0.88 FALSE
5  0.57   value < 0.9  TRUE
6  0.10  value > 0.01  TRUE
7  0.90  value >= 0.6  TRUE
8  0.25  value < 0.91  TRUE
9  0.04   value > 0.2 FALSE

Полагаю, в рамках dplyr есть удобное решение NSE. Я экспериментировал с !! и expr() и другими. Я получил некоторые многообещающие результаты при попытке установить подмножество condition с помощью

result <- df[0,]
for(i in 1:nrow(df)) { 
  result <- rbind(result, filter_(df[i,], bquote(.(df$condition[i]))))
}

Но мне не нравится решение, и оно не совсем то, что я ищу.

Я надеюсь, что кто-то может помочь.

ОБНОВЛЕНИЕ : Я пытаюсь избежать eval(parse(..)).

Ответы [ 4 ]

3 голосов
/ 23 апреля 2019

Использование match.fun :

# get function, and the value
myFun <- lapply(strsplit(df1$condition, " "), function(i){
  list(f = match.fun(i[ 2 ]), 
       v = as.numeric(i[ 3 ]))
})

df1$goal <- mapply(function(x, y){ 
  x[[ "f" ]](y, x[ "v" ])
  }, x = myFun, y = df1$value)

#   value     condition  goal
# 1  0.46   value > 0.5 FALSE
# 2  0.96 value == 0.79 FALSE
# 3  0.45 value <= 0.65  TRUE
# 4  0.68 value == 0.88 FALSE
# 5  0.57   value < 0.9  TRUE
# 6  0.10  value > 0.01  TRUE
# 7  0.90  value >= 0.6  TRUE
# 8  0.25  value < 0.91  TRUE
# 9  0.04   value > 0.2 FALSE
3 голосов
/ 23 апреля 2019

Не совсем уверен, ищите ли вы что-то подобное, однако вы также можете использовать lazy_eval() из lazyeval:

df %>%
 rowwise() %>%
 mutate(res = lazy_eval(sub("value", value, condition)))

  value condition     res  
  <dbl> <chr>         <lgl>
1 0.46  value > 0.5   FALSE
2 0.96  value == 0.79 FALSE
3 0.45  value <= 0.65 TRUE 
4 0.68  value == 0.88 FALSE
5 0.570 value < 0.9   TRUE 
6 0.1   value > 0.01  TRUE 
7 0.9   value >= 0.6  TRUE 
8 0.25  value < 0.91  TRUE 
9 0.04  value > 0.2   FALSE

И даже если оно очень близко к eval(parse(...)),также возможно использование parse_expr() из rlang:

df %>%
 rowwise() %>%
 mutate(res = eval(rlang::parse_expr(condition)))
3 голосов
/ 23 апреля 2019

Одно простое и простое решение будет использовать eval(parse...

library(dplyr)

df %>%
  rowwise() %>%
  mutate(goal = eval(parse(text = condition)))

# A tibble: 9 x 3
#  value condition     goal 
#  <dbl> <chr>         <lgl>
#1 0.46  value > 0.5   FALSE
#2 0.96  value == 0.79 FALSE
#3 0.45  value <= 0.65 TRUE 
#4 0.68  value == 0.88 FALSE
#5 0.570 value < 0.9   TRUE 
#6 0.1   value > 0.01  TRUE 
#7 0.9   value >= 0.6  TRUE 
#8 0.25  value < 0.91  TRUE 
#9 0.04  value > 0.2   FALSE

Однако я бы рекомендовал прочитать некоторые сообщения перед его использованием.

2 голосов
/ 23 апреля 2019

Если вы хотите избежать eval(parse..., вы можете попробовать это:

library(tidyverse)
df %>% mutate(bound = as.numeric(str_extract(condition, "[0-9 \\.]*$")),
              goal = case_when(grepl("==", condition) ~ value == bound,
                               grepl(">=", condition) ~ value >= bound,
                               grepl("<=", condition) ~ value <= bound,
                               grepl(">", condition) ~ value > bound,
                               grepl("<", condition) ~ value < bound,
                               T ~ NA))

  value     condition bound  goal
1  0.46   value > 0.5  0.50 FALSE
2  0.96 value == 0.79  0.79 FALSE
3  0.45 value <= 0.65  0.65  TRUE
4  0.68 value == 0.88  0.88 FALSE
5  0.57   value < 0.9  0.90  TRUE
6  0.10  value > 0.01  0.01  TRUE
7  0.90  value >= 0.6  0.60  TRUE
8  0.25  value < 0.91  0.91  TRUE
9  0.04   value > 0.2  0.20 FALSE
...