Думаю, у меня могут возникнуть проблемы с пониманием регулярных выражений в R.
Мне нужно извлечь телефонные номера и имена из образца вектора и создать фрейм данных с соответствующими столбцами для имен и номеров, используя функциональность пакета stringr.
Ниже приведен мой примерный вектор.
phones <- c("Ann 077-789663", "Johnathan 99656565",
"Maria2 099-65-6569 office")
Код, который я придумал, чтобы извлечь их, выглядит следующим образом
numbers <- str_remove_all(phones, pattern = "[^0-9]")
numbers <- str_remove_all(numbers, pattern = "[a-zA-Z]")
numbers <- trimws(numbers)
names <- str_remove_all(phones, pattern = "[A-Za-z]+", simplify = T)
phones_data <- data.frame("Name" = names, "Phone" = numbers)
Он не работает, так как он берет цифру в имени и соединяется с номером телефона. (тоже не оптимальный код)
Буду признателен за помощь в объяснении простейшего способа выполнения этой задачи.