Попытка написать несколько regex
в R, чтобы извлечь несколько слов между числами для каждой строки в символьном векторе R. К сожалению, мои regex
навыки не совсем соответствуют задаче.
Вот примерэтой проблемы и моей первоначальной попытки:
x <- c("1 Singleword 1,234 342", "2 randword & thirdword 1,545 323",
"3 Anotherword wordagain Newword. 3,234 556")
m <- regexpr("[a-zA-Z]+\\s+", x, perl = TRUE)
regmatches(x, m)
Этот подход дает только
"Singleword ", "randword ", "Anotherword "
Что мне нужно, это
"Singleword", "randword & thirdword", "Anotherword wordagain Neword."
Я считаю, что это нужно будеткакой-то шаблон regex
, который начинается с символа (как у меня сейчас), а затем тянет все, пока не будет достигнуто число.