Я создал списки для каждого слова, чтобы извлечь слова из предложений, например, вот так
hello<- NULL
for (i in 1:length(text)){
hello[i]<-as.character(regmatches(text[i], gregexpr("[H|h]ello?", text[i])))
}
Но у меня есть список из более чем 25 слов, который нужно извлечь, это очень длинный код. Можно ли извлечь группу символов (слов) из текстовых данных?
Ниже приведен только псевдо-набор.
words<-c("[H|h]ello","you","so","tea","egg")
text=c("Hello! How's you and how did saturday go?",
"hello, I was just texting to see if you'd decided to do anything later",
"U dun say so early.",
"WINNER!! As a valued network customer you have been selected" ,
"Lol you're always so convincing.",
"Did you catch the bus ? Are you frying an egg ? ",
"Did you make a tea and egg?"
)
subsets<-NULL
for ( i in 1:length(text)){
.....???
}
Ожидаемый результат, как показано ниже
[1] Hello you
[2] hello you
[3] you
[4] you so
[5] you you egg
[6] you tea egg