Преобразовать столбец списка в столбец строк - PullRequest
2 голосов
/ 14 мая 2019

Мои данные состоят из идентификатора (srdr_id) и столбца списка.

dat <- structure(list(srdr_id = c("174136", "174258", "174684"), outcomes = list(
    structure(list(outcome_s = c("use_alcohol", "use_cannabis", 
    "use_cocaine")), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, 
    -3L)), structure(list(outcome_s = "use_methamphetamine"), class = c("tbl_df", 
    "tbl", "data.frame"), row.names = c(NA, -1L)), structure(list(
        outcome_s = c("use_alcohol", "use_heavy")), class = c("tbl_df", 
    "tbl", "data.frame"), row.names = c(NA, -2L)))), class = c("tbl_df", 
"tbl", "data.frame"), row.names = c(NA, -3L))

> dat
# A tibble: 3 x 2
  srdr_id outcomes        
  <chr>   <list>          
1 174136  <tibble [3 x 1]>
2 174258  <tibble [1 x 1]>
3 174684  <tibble [2 x 1]>

Я хотел бы преобразовать каждый тибл в результатах в одну строку, разделенную запятой.

enter image description here

Ответы [ 2 ]

2 голосов
/ 14 мая 2019

Вы также можете использовать функцию map для итерации по столбцу списка, вытаскивая первый столбец каждого фрагмента и сворачиваясь в одну строку:

library(tidyverse)
dat <- structure(list(srdr_id = c("174136", "174258", "174684"), outcomes = list(structure(list(outcome_s = c("use_alcohol", "use_cannabis", "use_cocaine")), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, -3L)), structure(list(outcome_s = "use_methamphetamine"), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, -1L)), structure(list(outcome_s = c("use_alcohol", "use_heavy")), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, -2L)))), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, -3L))
dat %>%
  mutate(outcomes = map_chr(outcomes, ~ .[[1]] %>% str_c(collapse = ", ")))
#> # A tibble: 3 x 2
#>   srdr_id outcomes                              
#>   <chr>   <chr>                                 
#> 1 174136  use_alcohol, use_cannabis, use_cocaine
#> 2 174258  use_methamphetamine                   
#> 3 174684  use_alcohol, use_heavy

Создано в 2019-05-13 пакетом Представить (v0.2.1)

2 голосов
/ 14 мая 2019

Вот способ с tidyverse -

dat %>% 
  unnest(outcomes) %>% 
  group_by(srdr_id) %>% 
  summarise(
    outcomes = toString(outcome_s)
  )

# A tibble: 3 x 2
  srdr_id outcomes                              
  <chr>   <chr>                                 
1 174136  use_alcohol, use_cannabis, use_cocaine
2 174258  use_methamphetamine                   
3 174684  use_alcohol, use_heavy        
...