Итак, у меня есть столбец в кадре данных, который содержит несколько имен, таких как:
colnames <- c("YouAreHappy","YouAreHappy1", "YouAreHappy2", "NiceSmiles", "NiceSmiles1", "NiceSmiles2")
Я пытаюсь использовать функцию stringr
* str_extract
, чтобы извлечь только определенную часть имена именно такие вещи, как "Happy", "Happy1", "Happy2", "Smiles", "Smiles1" и "Smiles2".
Я попытался использовать регулярное выражение с `str_extract 'следующим образом:
> str_extract(colnames, regex("Happy|Happy1|Happy2|Smiles|Smiles1|Smiles2"))
[1] "Happy" "Happy" "Happy" "Smiles" "Smiles" "Smiles"
Но я хочу извлечь:
[1] "Happy" "Happy1" "Happy2" "Smiles" "Smiles1" "Smiles2"
Я, очевидно, поступаю неправильно, но я не знаю, где и как.Я понимаю, что |
подразумевает OR
, но я не знаю достаточно о регулярных выражениях, чтобы обойти это препятствие.Я совершенно новичок в регулярных выражениях и тому подобном (только что обнаружил регулярные выражения 101 ), поэтому любые указатели приветствуются.