Использование case_when с несколькими векторами - PullRequest
2 голосов
/ 29 марта 2019

Я пытаюсь использовать case_when для изменения / изменения столбца на основе двух отдельных входов. Тот, который используется для создания логической LHS и соответствующего входного значения в RHS. Пример приведен ниже.

library(dplyr)
library(purrr)
library(tibble)

df <- tibble(var = paste0(rep("var", 10), 1:10),
                 label = c("label1", "label2", rep(NA, 7), "label10"))

match_var <- paste0(rep("var", 7), 3:9)
new_labels <- paste0(rep("add_this_label", 7), 3:9)

df %>% 
  mutate(test = map2(match_var , new_labels,
                     ~case_when(
                       var == .x ~ .y,
                       TRUE ~ label
                     )
  ))

Я думаю, проблема в том, что в case_when все оценивается как выражение, но я не совсем уверен. Можно ввести вручную все 7 строк в case_when, но мое приложение требует, чтобы я выполнил это, когда векторы match_vars и new_labels очень длинные, что делает ручную печать case_when неосуществимой.

df %>% 
  mutate(label = case_when(
    var == match_var[1] ~ new_labels[1],
    var == match_var[2] ~ new_labels[2],
    var == match_var[3] ~ new_labels[3],
    var == match_var[4] ~ new_labels[4],
    var == match_var[5] ~ new_labels[5],
    var == match_var[6] ~ new_labels[6],
    var == match_var[7] ~ new_labels[7],
    TRUE ~ label
  ))

РЕДАКТИРОВАТЬ : желаемый результат может быть достигнут с помощью цикла for, но теперь я хочу знать, возможно ли это с использованием функций case_when и map2_*?

for (i in seq_along(match_var)) {
  df$label <- ifelse(df$var == match_var[i], new_labels[i], df$label)
}

Ответы [ 2 ]

2 голосов
/ 29 марта 2019

Мы создаем именованный вектор и используем его для сопоставления со значениями в 'var', чтобы изменить элементы NA на 'new_labels'

library(tibble)
library(dplyr)
df %>%
    mutate(label = case_when(is.na(label) ~ 
                       deframe(tibble(match_var, new_labels))[var], 
         TRUE ~ label))
# A tibble: 10 x 2
#   var   label          
#   <chr> <chr>          
# 1 var1  label1         
# 2 var2  label2         
# 3 var3  add_this_label3
# 4 var4  add_this_label4
# 5 var5  add_this_label5
# 6 var6  add_this_label6
# 7 var7  add_this_label7
# 8 var8  add_this_label8
# 9 var9  add_this_label9
#10 var10 label10        

ПРИМЕЧАНИЕ. Вместо использования deframe,Именованный вектор также можно создать с помощью setNames

1 голос
/ 29 марта 2019

Вы можете присоединить новые метки к фрейму данных и при необходимости заполнить старую метку.

library("tidyverse")

df <- tibble(var = paste0(rep("var", 10), 1:10),
             label = c("label1", "label2", rep(NA, 7), "label10"))

match_var <- paste0(rep("var", 7), 3:9)
new_label <- paste0(rep("add_this_label", 7), 3:9)

new_labels <-  tibble(match_var, new_label)

df %>%
  left_join(new_labels, by = c("var" = "match_var")) %>%
  mutate(new_label = if_else(is.na(new_label), label, new_label))
#> # A tibble: 10 x 3
#>    var   label   new_label      
#>    <chr> <chr>   <chr>          
#>  1 var1  label1  label1         
#>  2 var2  label2  label2         
#>  3 var3  <NA>    add_this_label3
#>  4 var4  <NA>    add_this_label4
#>  5 var5  <NA>    add_this_label5
#>  6 var6  <NA>    add_this_label6
#>  7 var7  <NA>    add_this_label7
#>  8 var8  <NA>    add_this_label8
#>  9 var9  <NA>    add_this_label9
#> 10 var10 label10 label10

Создано в 2019-03-28 пакетом представ. (v0.2.1)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...