R - Purrr - применить функцию к Tibbles в списке - PullRequest
1 голос
/ 01 мая 2020

Мне нужна помощь в применении функции к четырем элементам, индивидуально хранящимся в одном и том же списке.

Функция:

status_fun <- function(Status,
                       Escalated,
                       Created,
                       Resolved
                       ){
  if(Escalated == "Yes"){
    return("Escalated")
    } else if(Status == "Closed" && (month(Created) == month(Resolved) || Resolved - Created < 5
              )
    ){
      return("Closed")
    } else {
      return("Not Solved")
    }
}

У меня есть список с 4 элементами внутри разных размеров. Я просто хочу применить вышеописанную функцию, которая использует четыре столбца для каждого фрагмента, но я получаю всевозможные ошибки. Я искал столько, сколько смогу и читал здесь R4DS и другие сообщения, но не могу найти решение.


dummy %>%
   map(., status_fun)
Error in .f(.x[[i]], ...) : 
 argument "Escalated" is missing with no default

dummy %>%
   map(~ map(., status_fun))
Error in .f(.x[[i]], ...) : 
  argument "Escalated" is missing with no default

Следующее возвращает список только с одним значением, которым я не являюсь интерес, я хочу список с четырьмя столбцами с теми же размерами (строки), что и входные данные

dummy %>%
   map(., ~ status_fun(Status = 'Status', Escalated = 'Escalated', Created = 'Created', Resolved = 'Resolved'))
[[1]]
[1] "Not Solved"

[[2]]
[1] "Not Solved"

[[3]]
[1] "Not Solved"

[[4]]
[1] "Not Solved"

Пустой список выглядит следующим образом:

[[1]]
# A tibble: 589 x 5
   Created    Resolved   Status      Country    Escalated
   <date>     <date>     <chr>       <chr>      <chr>    
 1 2020-04-03 2020-04-08 Closed      Luxembourg No       
 2 2020-03-31 NA         In Progress France     No       
 3 2020-03-31 NA         In Progress France     No       
 4 2020-03-31 NA         In Progress Luxembourg No       
 5 2020-03-31 NA         In Progress Luxembourg No       
 6 2020-03-30 NA         In Progress France     Yes       
 7 2020-03-27 NA         In Progress Ireland    No       
 8 2020-03-27 2020-04-10 Closed      Luxembourg No       
 9 2020-03-27 NA         In Progress Luxembourg No       
10 2020-03-27 2020-03-30 Closed      Ireland    No       
# ... with 579 more rows

[[2]]
# A tibble: 316 x 5
   Created    Resolved   Status               Country    Escalated
   <date>     <date>     <chr>                <chr>      <chr>    
 1 2020-04-13 NA         Open                 Luxembourg No       
 2 2020-04-13 NA         Open                 Spain      No       
 3 2020-04-07 NA         Open                 France     No       
 4 2020-04-03 NA         In Progress          Luxembourg No       
 5 2020-03-30 NA         Awaiting Information Luxembourg No       
 6 2020-03-30 NA         Awaiting Information France     Yes       
 7 2020-03-30 2020-03-31 Closed               France     No       
 8 2020-03-30 NA         Awaiting Information France     No       
 9 2020-03-30 NA         Awaiting Information Spain      No       
10 2020-03-30 NA         Awaiting Information Sweden     No       
# ... with 306 more rows

[[3]]
# A tibble: 64 x 5
   Created    Resolved   Status               Country Escalated
   <date>     <date>     <chr>                <chr>   <chr>    
 1 2020-04-13 NA         Open                 Chile   No       
 2 2020-04-10 NA         Open                 Mexico  Yes      
 3 2020-04-10 NA         Awaiting Information Mexico  No       
 4 2020-04-09 NA         Open                 Chile   No       
 5 2020-04-03 2020-04-06 Closed               Mexico  Yes       
 6 2020-04-02 2020-04-02 Closed               Mexico  No       
 7 2020-04-01 2020-04-01 Closed               Mexico  No       
 8 2020-03-31 2020-04-01 Closed               Brazil  No       
 9 2020-03-30 2020-03-31 Closed               Mexico  No       
10 2020-03-27 2020-04-06 Closed               Mexico  No       
# ... with 54 more rows

[[4]]
# A tibble: 30 x 5
   Created    Resolved   Status      Country Escalated
   <date>     <date>     <chr>       <chr>   <chr>    
 1 2020-04-13 NA         Open        Chile   No       
 2 2020-04-07 NA         Open        Brazil  No       
 3 2020-03-23 2020-03-25 Closed      Chile   No       
 4 2020-03-17 2020-03-18 Closed      Chile   No       
 5 2020-03-16 NA         Open        Mexico  No       
 6 2020-03-11 2020-03-11 Closed      Brazil  No       
 7 2020-03-11 2020-03-12 Closed      Brazil  No       
 8 2020-03-10 2020-03-10 Closed      Brazil  No       
 9 2020-03-09 NA         In Progress Brazil  No       
10 2020-03-02 2020-03-03 Closed      Brazil  No       
# ... with 20 more rows

Что такое Я пропустил? Я пробовал все виды pmap, map_2, инструкции здесь Код не работает с использованием map из пакета purrr в R и здесь Применение функции к вложенным l oop ( пакет purrr?) безуспешно. Заранее благодарим за то, что кто-то готов уделить время моей проблеме.

Ответы [ 2 ]

2 голосов
/ 02 мая 2020

Одна проблема заключается в том, что вы передаете один data.frame функции, которая ожидает 4 аргумента. Чтобы исправить это, вы можете изменить свою функцию на:

new_fx = function (DF) {
Status = DF$Status
Escalated = DF$Escalated
...
}
map(dummy, new_fx)

Следующая потенциальная проблема - это использование if ... else.... Поскольку это был не воспроизводимый пример с ожидаемым выводом, я предполагаю, что вы хотите добавить столбец с оператором if ... else.... Вам захочется избавиться от двойных && и ||, потому что они будут иметь одно логическое значение.

Вместе с этим переключитесь на ifelse или, поскольку вы находитесь в , вы можете использовать case_when(), чтобы получить вектор ожидаемой длины.

0 голосов
/ 04 мая 2020

Для тех, кто борется с изменяющимися столбцами в нескольких столбцах внутри объекта списка, приведенный ниже код работал над проблемой, описанной выше:

status_fun <- function(df){
  Escalated = df$Escalated
  Status = df$Status
  Created = df$Created
  Resolved = df$Resolved

  dplyr::mutate(df,
    Status = case_when(


      Escalated == "Yes" ~ "Escalated",


      (Status == "Closed" &


         (month(Created) == month(Resolved) | Resolved - Created < 5)) ~ "Closed",

      TRUE ~ "Not Solved"
    )
  )
}

dummy <-  dummy %>% map(., status_fun)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...