IF_ELSE оператор не работает, как ожидалось - PullRequest
0 голосов
/ 09 ноября 2019

Я пытаюсь создать новую переменную на основе условной оценки ряда других переменных. Я использую некоторые вложенные операторы "if_else", но только часть условного оператора оценивается так, как я хочу.

Вот данные для некоторых примеров данных:

structure(list(`Cultivation` = c("No", "No", "Yes", 
"Yes", "No", "Yes", "No", "No", "No", "No", "Yes", "Yes"), 
`Processing` = c("No", 
"No", "Yes", "Yes", "No", "No", "No", "No", "No", "No", "No", 
"Yes"), `Federal Sales` = c("No", "No", "Yes", "Yes", "Yes", 
"Yes", "No", "No", "No", "No", "Yes", "Yes"), `Cultivation 
Type` = c(NA, 
NA, "Standard", "Standard", NA, "Micro", NA, NA, NA, NA, "Nursery", 
"Standard"), `Processing Type` = c(NA, NA, "Standard", 
"Standard", NA, NA, NA, NA, NA, NA, NA, "Standard"), `Type` = c(NA, 
NA, "Standard", "Standard", NA, "Micro", NA, NA, NA, NA, NA, 
"Standard")), class = c("tbl_df", "tbl", "data.frame"), row.names = c(NA, 
-12L))

Здесьэто код, который я использую:

DF.2 <- DF.1 %>%
  dplyr::mutate("Type" = if_else(str_detect(tolower(`Cultivation Type`), 
"micro") |

str_detect(tolower(`Processing Type`), "micro"), "Micro",

if_else(str_detect(tolower(`Cultivation Type`), "standard") |

str_detect(tolower(`Processing Type`), "standard"), "Standard",

if_else(str_detect(tolower(`Cultivation Type`), "nursery"), 
"Nursery","Other"))))

Первые два условия выполняются, и я получаю переменную типа "стандартный" или "микро", но "питомник" и "другие" не оцениваюти я получаю "NA".

Ответы [ 2 ]

1 голос
/ 09 ноября 2019

Лучше всего использовать case_when в вашем случае вместо if_else. Здесь все NA привели к Other:

library(dplyr)
library(stringr)

DF.2 <- DF.1 %>%
  mutate("Type" = case_when(
    str_detect(tolower(`Cultivation Type`),"micro") | str_detect(tolower(`Processing Type`), "micro") ~ "Micro",
    str_detect(tolower(`Cultivation Type`), "standard") | str_detect(tolower(`Processing Type`), "standard") ~ "Standard",
    str_detect(tolower(`Cultivation Type`), "nursery") ~ "Nursery",
    TRUE ~ "Other")
  )

Вывод:

> DF.2
# A tibble: 12 x 6
   Cultivation Processing `Federal Sales` `Cultivation Type` `Processing Type` Type    
   <chr>       <chr>      <chr>           <chr>              <chr>             <chr>   
 1 No          No         No              NA                 NA                Other   
 2 No          No         No              NA                 NA                Other   
 3 Yes         Yes        Yes             Standard           Standard          Standard
 4 Yes         Yes        Yes             Standard           Standard          Standard
 5 No          No         Yes             NA                 NA                Other   
 6 Yes         No         Yes             Micro              NA                Micro   
 7 No          No         No              NA                 NA                Other   
 8 No          No         No              NA                 NA                Other   
 9 No          No         No              NA                 NA                Other   
10 No          No         No              NA                 NA                Other   
11 Yes         No         Yes             Nursery            NA                Nursery 
12 Yes         Yes        Yes             Standard           Standard          Standard
> 
0 голосов
/ 09 ноября 2019

Нам нужно внести некоторые изменения в код, чтобы вернуть только TRUE/FALSE, поскольку элементы NA возвращают только NA, и это может привести к проблеме

library(dplyr)
DF.1 %>%
  dplyr::mutate("Type" = if_else((str_detect(tolower(`Cultivation Type`), "micro") | str_detect(tolower(`Processing Type`), "micro")) & !(is.na(`Cultivation Type`) |  is.na(`Processing Type`)), "Micro",

     if_else((str_detect(tolower(`Cultivation Type`), "standard") | str_detect(tolower(`Processing Type`), "standard")) & !(is.na(`Cultivation Type`) | is.na(`Processing Type`)), "Standard",

     if_else(str_detect(tolower(`Cultivation Type`), "nursery") & !is.na(`Cultivation Type`),  "Nursery","Other"))))
# A tibble: 12 x 6
#   Cultivation Processing `Federal Sales` `Cultivation Type` `Processing Type` Type    
#   <chr>       <chr>      <chr>           <chr>              <chr>             <chr>   
# 1 No          No         No              <NA>               <NA>              Other   
# 2 No          No         No              <NA>               <NA>              Other   
# 3 Yes         Yes        Yes             Standard           Standard          Standard
# 4 Yes         Yes        Yes             Standard           Standard          Standard
# 5 No          No         Yes             <NA>               <NA>              Other   
# 6 Yes         No         Yes             Micro              <NA>              Other   
# 7 No          No         No              <NA>               <NA>              Other   
# 8 No          No         No              <NA>               <NA>              Other   
# 9 No          No         No              <NA>               <NA>              Other   
#10 No          No         No              <NA>               <NA>              Other   
#11 Yes         No         Yes             Nursery            <NA>              Nursery 
#12 Yes         Yes        Yes             Standard           Standard          Standard

Или еслинам нужно использовать тот же код, что и в посте OP, просто замените NA в столбцах «Тип» до и измените значение, замененное на NA после преобразований

DF.1 %>% 
    mutate_at(vars(ends_with('Type')), replace_na, 'new') %>% 
   dplyr::mutate("Type" = if_else(str_detect(tolower(`Cultivation Type`), 
 "micro") |

 str_detect(tolower(`Processing Type`), "micro"), "Micro",

 if_else(str_detect(tolower(`Cultivation Type`), "standard") |

 str_detect(tolower(`Processing Type`), "standard"), "Standard",

 if_else(str_detect(tolower(`Cultivation Type`), "nursery"), 
 "Nursery","Other")))) %>% 
   mutate_at(vars(ends_with('Type')), na_if, 'new')

Если мыинтересует другие более простые варианты, другой вариант - создать набор ключей / val, а затем выполнить fuzzyjoin

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...