Я хочу разбить столбец на несколько столбцов, сопоставляя шаблоны
test <- data.frame("id" = c("Albertson's Inc.","Albertson's Inc."), "V3" = c("Reiterates FY 2004, Significant Developments, 2 June 2004, 53 words, (English)(Document MULTI00020050122e06201fkk)","EBITDA Hits Four Year Low, Stock Diagnostics, 16:00 GMT, 9 June 2004, 245 words, (English)(Document STODIA0020040609e0690006g)"), stringsAsFactors = F)
Пока что код, который я использую для получения желаемого результата, похож на
library(stringr)
df <- as.data.frame(str_match(test$V3, "^(.*)GMT,(.*),(.*)words,(.*)Document (.*)$")[,-1], stringsAsFactors = F)
Явозникли две проблемы с приведенным выше кодом. Во-первых, он не показывает результаты, когда отсутствует GMT, во-вторых, я хочу также столбец «id» в выводе df, любые предложения или другой подход, который я должен использовать для результатов, пожалуйста, поделитесь спасибо всем модераторам-программистам за такиеполезный форум.