(В R gsub (),) мне нужно записать четыре слова, встречающиеся после определенной фразы, в большую строку.Опираясь на предложенную мудрость здесь , я придумал: ^.*\\b(particular phrase)\\W+(\\w+\\W+\\w+\\W+\\w+\\W+\\w+).*$
Например:
this_txt <- "Blah blah particular phrase Extract These Words Please for the blah blah. Ignore blah this other stuff blah blah, blah."
this_pattern <- "^.*\\b(particular phrase)\\W+(\\w+\\W+\\w+\\W+\\w+\\W+\\w+).*$"
gsub(this_pattern, "\\2", this_txt, ignore.case = T)
# [1] "Extract These Words Please"
Но повторение \\w+\\W+
в схемедовольно неприлично.Конечно, есть лучший способ.Я думал, что ^.*\\b(particular phrase)\\W+(\\w+\\W+){4}.*$
может работать, но это не так.