У меня есть список цветов, которые я пытаюсь извлечь из образца набора данных. Кажется, пропустить одни цвета и найти другие.
color_list <- c("gray", "brown", "green", "plum", "mist", "forest", "sienna", "grape", "ruby", "emerald", "copper",
"silver", "gold", "blue")
str_extract(df, fixed(color_list, ignore_case = TRUE))
[1] "GRAY" NA NA NA NA NA NA NA NA NA NA "silver" "GOLD" "blue"
Все же первый матч должен быть "серебряным".
Пример данных:
structure(list(df = c("Tsilver flash mirror", "E:~ ADD FLASH FRONT MI",
"E:~", "E##T Color: G 15#3; MC", "E:~ ## PLEASE USE 8 BA", "E:~ ## blue flash ##",
"E:~ ## Silver Mirror #", "Ssilver mirror", "E:~ ## Treatment: Fee-",
"E:~Further Instruction", "E:~ ## FORREST GRAY Xp", "ESILVER",
"EGOLD")), class = "data.frame", row.names = c("1", "2", "3",
"4", "5", "6", "7", "8", "9", "10", "11", "12", "13"))
И возможно ли сделать "нечеткое" сопоставление с Str_Extract? Так как в данных есть некоторые орфографические ошибки.