Функция для регулярного выражения в R - PullRequest
0 голосов
/ 29 января 2020

Мне нужно извлечь определенные последовательности из строки текста. Что-то вроде 93085k82 будет встроено в текст. Есть ли скрипт, который идентифицирует, когда встречаются 5 цифр, буква, а затем 2 цифры?

1 Ответ

1 голос
/ 29 января 2020

Мы можем использовать шаблон, начинающийся с границы слова (\\b), за которой следуют пять цифр (\\d{5}), строчная буква ([a-z]{1}) и две цифры (\\d{2}), за которыми следует граница слова (\\b)

grep("\\b\\d{5}[a-z]{1}\\d{2}\\b", v1)

Если нам нужно извлечь

library(stringr)
str_extract_all(v1, "\\b\\d{5}[a-z]{1}\\d{2}\\b")
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...