используя purrr для отображения dplyr :: select - PullRequest
0 голосов
/ 11 мая 2018

У меня есть фрейм данных с кучей вложенных фреймов в нем, и я хотел бы применить dplyr :: select к каждому из этих вложенных фреймов данных.Вот пример

 library(tidyverse)

 mtcars %>%
 group_by(cyl) %>%
 nest %>%
 mutate(data2 = ~map(data, dplyr::select(.,-mpg)))

Я думаю, что это приведет к кадру данных с тремя столбцами.cyl: число цилиндров, data: вложенные данные, data2: то же самое, что и данные, за исключением того, что у каждого элемента не будет столбца mpg.

Вместо R происходит сбой:

 *** caught segfault ***
address 0x7ffc1e445000, cause 'memory not mapped'

Traceback:
 1: .Call(`_dplyr_mutate_impl`, df, dots)
 2: mutate_impl(.data, dots)
 3: mutate.tbl_df(., data2 = ~map(data, dplyr::select(., -mpg)))
 4: mutate(., data2 = ~map(data, dplyr::select(., -mpg)))
 5: function_list[[k]](value)
 6: withVisible(function_list[[k]](value))
 7: freduce(value, `_function_list`)
 8: `_fseq`(`_lhs`)
 9: eval(quote(`_fseq`(`_lhs`)), env, env)
10: eval(quote(`_fseq`(`_lhs`)), env, env)
11: withVisible(eval(quote(`_fseq`(`_lhs`)), env, env))
12: mtcars %>% group_by(cyl) %>% nest %>% mutate(data2 = ~map(data,     dplyr::select(., -mpg)))

Possible actions:
1: abort (with core dump, if enabled)
2: normal R exit
3: exit R without saving workspace
4: exit R saving workspace

Я понимаю, что мог бы получить нужные столбцы, если бы применил операцию выбора перед вложением, но это было бы менее аналогично моей реальной проблеме.Может кто-нибудь объяснить мне, что я здесь делаю не так?Спасибо за любой совет.

Ответы [ 2 ]

0 голосов
/ 11 мая 2018

Вот 2 способа: один пропускает вложение и просто использует do, а второй - и затем использует map.unnest(data2) затем возвращает его в обычный фрейм данных.Стоит отметить, что я включил -cyl в select в первом примере;Это потому, что в противном случае вы получите cyl дважды, один раз из столбца группировки и один раз из неопубликованного фрейма данных.

Я не уверен, что один из них лучше другого,помимо личных предпочтений.

library(tidyverse)

mtcars %>%
    group_by(cyl) %>%
    do(data2 = select(., -mpg, -cyl)) %>%
    unnest(data2)
#> # A tibble: 32 x 10
#>      cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
#>    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#>  1     4 108      93  3.85  2.32  18.6     1     1     4     1
#>  2     4 147.     62  3.69  3.19  20       1     0     4     2
#>  3     4 141.     95  3.92  3.15  22.9     1     0     4     2
#>  4     4  78.7    66  4.08  2.2   19.5     1     1     4     1
#>  5     4  75.7    52  4.93  1.62  18.5     1     1     4     2
#>  6     4  71.1    65  4.22  1.84  19.9     1     1     4     1
#>  7     4 120.     97  3.7   2.46  20.0     1     0     3     1
#>  8     4  79      66  4.08  1.94  18.9     1     1     4     1
#>  9     4 120.     91  4.43  2.14  16.7     0     1     5     2
#> 10     4  95.1   113  3.77  1.51  16.9     1     1     5     2
#> # ... with 22 more rows

mtcars %>%
    group_by(cyl) %>%
    nest() %>%
    mutate(data2 = map(data, function(df) select(df, -mpg))) %>%
    unnest(data2)
#> # A tibble: 32 x 10
#>      cyl  disp    hp  drat    wt  qsec    vs    am  gear  carb
#>    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
#>  1     6  160    110  3.9   2.62  16.5     0     1     4     4
#>  2     6  160    110  3.9   2.88  17.0     0     1     4     4
#>  3     6  258    110  3.08  3.22  19.4     1     0     3     1
#>  4     6  225    105  2.76  3.46  20.2     1     0     3     1
#>  5     6  168.   123  3.92  3.44  18.3     1     0     4     4
#>  6     6  168.   123  3.92  3.44  18.9     1     0     4     4
#>  7     6  145    175  3.62  2.77  15.5     0     1     5     6
#>  8     4  108     93  3.85  2.32  18.6     1     1     4     1
#>  9     4  147.    62  3.69  3.19  20       1     0     4     2
#> 10     4  141.    95  3.92  3.15  22.9     1     0     4     2
#> # ... with 22 more rows

Создано в 2018-05-11 пакетом представительство (v0.2.0).

0 голосов
/ 11 мая 2018

Вам необходимо переместить ~ с map на select; или используйте комментарий как @Russ; ~ используется, когда функция (в данном случае purrr::map) принимает формулу в качестве аргумента:

mtcars %>%
    group_by(cyl) %>%
    nest %>%
    mutate(data2 = map(data, ~ select(., -mpg)))

# A tibble: 3 x 3
#    cyl data               data2            
#  <dbl> <list>             <list>           
#1     6 <tibble [7 × 10]>  <tibble [7 × 9]> 
#2     4 <tibble [11 × 10]> <tibble [11 × 9]>
#3     8 <tibble [14 × 10]> <tibble [14 × 9]>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...