У меня очень грязный фрейм данных с одним столбцом со значениями, понятными для людей, но не для компьютеров, немного похожими на приведенный ниже.
df<-data.frame("id"=c(1:10),
"colour"=c("re d", ", red", "re-d","green", "gre, en", ", gre-en", "blu e", "green", ", blue", "bl ue"))
Я могу отфильтровать df с помощью str_detect
df %>% filter(str_detect(tolower(colour), pattern = "gr"))
Но я хочу переименовать все отфильтрованные результаты в одно и то же значение, чтобы я мог их обрезать.
Любойпредложения?
Я пытался расстаться с шаблоном, но безуспешно.
РЕДАКТИРОВАТЬ: Не все.и пробелы не нужны в df, с которым я работаю.Допустим, правильный способ написания зелёного в готовом df - «gr. Een».
EDIT2:
Требуется результат с имитацией правописания цветов, просто чтобы получить представление:
id colour
1 r. ed
2 r. ed
3 r. ed
4 gr. een
6 gr. een
7 gr. een
8 blu. e
9 gr. een
10 blu. e