R dplyr: условный мутат, основанный на группах - PullRequest
0 голосов
/ 05 сентября 2018

В настоящее время я работаю над следующей проблемой:

Я пытаюсь разбить свой набор данных по группам и создать новую переменную, которая фиксирует среднее по группам всех противоположных случаев, которые не принадлежат этой группе, за определенный период времени.

Вот копия моего кода с использованием набора данных mpg.

cars <- mpg

cars$other_cty_yearly_mean <- 0

for(i in cars$cyl){
  cars <- cars %>%
    group_by(year) %>%
    mutate(other_cty_yearly_mean = if_else(
      cyl == i,
      mean(cty[cyl != i]),
      other_cty_yearly_mean
    )) %>%
    ungroup() %>%
    as.data.frame()
}

Есть ли лучший способ, который не делает цикл for необходимым?

Спасибо и всего наилучшего!

1 Ответ

0 голосов
/ 05 сентября 2018

Вы можете использовать map_dbl из purrr для преобразования вашего цикла for:

mpg %>% 
  group_by(year) %>% 
  mutate(other_cty_yearly_mean = map_dbl(cyl, ~ mean(cty[!cyl %in% .x])))

# A tibble: 234 x 12
# Groups:   year [2]
#   manufacturer model      displ  year   cyl trans      drv     cty   hwy fl    class   other_cty_yearly_mean
#   <chr>        <chr>      <dbl> <int> <int> <chr>      <chr> <int> <int> <chr> <chr>                   <dbl>
# 1 audi         a4           1.8  1999     4 auto(l5)   f        18    29 p     compact                  14.6
# 2 audi         a4           1.8  1999     4 manual(m5) f        21    29 p     compact                  14.6
# 3 audi         a4           2    2008     4 manual(m6) f        20    31 p     compact                  14.7
# 4 audi         a4           2    2008     4 auto(av)   f        21    30 p     compact                  14.7
# 5 audi         a4           2.8  1999     6 auto(l5)   f        16    26 p     compact                  17.6
# ... with 229 more rows
...