Как подмножество слов с определенным количеством гласных в rstudio? - PullRequest
0 голосов
/ 31 марта 2019

Я пытаюсь составить список слов, имеющих 5 или более гласных букв, используя функцию str_subset в rstudio. Тем не менее, не могу понять это. Есть ли какие-либо предложения по этому вопросу?

1 Ответ

1 голос
/ 31 марта 2019

Поскольку вы, очевидно, используете stringr, функция str_count даст вам то, что вы ищете.Предполагая, что ваш «список слов» означает символьный вектор из отдельных слов, нужно выполнить следующее:

testStrings <- c("Brillig", "slithey", "TOVES",
                 "Abominable", "EQUATION", "Multiplication", "aaagh")

VowelCount <- str_count(testString, pattern = "[AEIOUaeiou]")
OutputStrings <- testStrings[VowelCount >= 5]

Часть в квадратных скобках является регулярным выражением, которое соответствует любой заглавной или строчной гласной в английском языке.,Конечно, другие языки имеют разные наборы гласных, которые вам, возможно, придется принять во внимание.Если вы хотите сделать то же самое в базе R, следующий однострочный должен сделать это:

OutputStrings <- grep("([AEIOUaeiou].*){5,}", testStrings, value = TRUE)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...