У меня есть группа имен, написанных странным образом. Вот пример:
Sammy WatkinsS. Watkins
Buffalo BillsBUF
New England PatriotsNE
Tre'Quan SmithT. Smith
JuJu Smith-SchusterJ. Smith-Schuster
Моя цель состоит в том, чтобы очистить его, чтобы в качестве имени возвращались либо имя, либо фамилия, либо имена, либо просто имена команд. Вот что попробовали:
df$name <- sub("^(.*[a-z])[A-Z]", "\\1", "\\1", df$name)
Это то, что я получаю, вернувшись
Sammy WatkinsS. Watkins
Buffalo BillsBUF
New England PatriotsNE
Tre'Quan SmithT. Smith
JuJu Smith-SchusterJ. Smith-Schuster
Чтобы было ясно, цель будет иметь следующее:
Sammy Watkins
Buffalo Bills
New England Patriots
Tre'Quan Smith
JuJu Smith-Schuster
данные
df <- data.frame(name = c(
"Sammy WatkinsS. Watkins",
"Buffalo BillsBUF",
"New England PatriotsNE",
"Tre'Quan SmithT. Smith",
"JuJu Smith-SchusterJ. Smith-Schuster"),
stringsAsFactors = FALSE)