Если день и месяц записаны в виде символов, то при вызове dplyr::case_when()
можно использовать регулярные выражения:
library(dplyr)
df <- df %>%
mutate(
day_of_the_week = case_when(
grepl("mon", date, ignore.case = T) ~ "mon",
grepl("tue", date, ignore.case = T) ~ "tues",
grepl("wed", date, ignore.case = T) ~ "wed",
grepl("thu", date, ignore.case = T) ~ "thurs",
grepl("fri", date, ignore.case = T) ~ "fri",
grepl("sat", date, ignore.case = T) ~ "sat",
grepl("sun", date, ignore.case = T) ~ "sun",
T ~ NA_character_
),
month = case_when(
grepl("jan", date, ignore.case = T) ~ "jan",
grepl("feb", date, ignore.case = T) ~ "feb",
grepl("mar", date, ignore.case = T) ~ "mar",
grepl("apr", date, ignore.case = T) ~ "apr",
grepl("may", date, ignore.case = T) ~ "may",
grepl("jun", date, ignore.case = T) ~ "jun",
grepl("jul", date, ignore.case = T) ~ "jul",
grepl("aug", date, ignore.case = T) ~ "aug",
grepl("sep", date, ignore.case = T) ~ "sep",
grepl("oct", date, ignore.case = T) ~ "oct",
grepl("nov", date, ignore.case = T) ~ "nov",
grepl("dec", date, ignore.case = T) ~ "dec",
T ~ NA_character_
)
)
# dataid date day_of_the_week month
# 1 1 Tue 11/3 tues <NA>
# 2 2 Wed 11/4 wed <NA>
# 3 3 <NA> <NA> <NA>
# 4 4 Monday, February 1, 2016 mon feb
# 5 5 Thursday, March 25, 2015 thurs mar
Выделить номер дня / месяца сложнее (вы могли быаналогичным образом для дней месяца между 13 и 31, но в противном случае невозможно узнать, является ли число днем или месяцем.)
Данные
df <- read.table(text = "
dataid date
1 'Tue 11/3'
2 'Wed 11/4'
3 N/A
4 'Monday, February 1, 2016'
5 'Thursday, March 25, 2015'",
header = T,
stringsAsFactors = F,
na.strings = "N/A")