Применить функцию на разных уровнях - PullRequest
0 голосов
/ 12 сентября 2018

У меня следующий тиббл:

library(tidyverse)

set.seed(1234)

df <- tibble(
  x1 = letters[1:2],
  y1 = list(
    tibble(
      x2 = letters[3:4],
      y2 = list(
        tibble(
          x3 = seq(1, 100, 1),
          y3 = rnorm(100)
        )
        )
      )
    )
)

И мне нужно получить доступ к таблице внутри таблицы, содержащей x3 и y3, и применить пользовательскую функцию к каждому фрейму данных. Для простоты, скажем, мне нужно применить base::mean() к y3.

Мои реальные данные намного больше этого, поэтому я ищу чистый и эффективный способ сделать это. Есть идеи?

Ответы [ 2 ]

0 голосов
/ 13 сентября 2018

Не могли бы вы просто развернуть свой путь вниз?

 df %>% unnest() %>% unnest() %>% 
   group_by(x2) %>% 
   summarise(mean(y3))

# A tibble: 2 x 2
  x2    `mean(y3)`
  <chr>      <dbl>
1 c         -0.157
2 d         -0.157

Не уверен, как вы хотите, чтобы ваш окончательный кадр данных выглядел, но вот еще одно предложение

 df %>% unnest() %>% 
   mutate(y3.average = map(y2, ~mean(.$y3)) ) %>% 
   unnest(y3.average)

# A tibble: 4 x 4
  x1    x2    y2                 y3.average
  <chr> <chr> <list>                  <dbl>
1 a     c     <tibble [100 × 2]>     -0.157
2 a     d     <tibble [100 × 2]>     -0.157
3 b     c     <tibble [100 × 2]>     -0.157
4 b     d     <tibble [100 × 2]>     -0.157
0 голосов
/ 12 сентября 2018

Вам нужно найти уровень, на котором вы хотите применить функцию (что я делаю с помощью индексации в скобках), а затем применить функцию. Я надеюсь, что это переносится на то, что вам нужно сделать.

> df[["y1"]][[1]][[2]] %>% lapply(., function(x){mean(x$y3)})

[[1]]
[1] 0.04124318

[[2]]
[1] 0.04124318
...