Вы можете использовать stringr
Вы можете сначала извлечь все возрасты из вашего текста, а затем вычислить дальнейший анализ. Этот код поможет (если ваш вектор строки называется str
):
library(stringr)
ages <- str_extract_all(str, "(\\d{1,2}[MY]O[MF])", simplify = TRUE)
Вариант использования:
library(stringr)
str <- c("DX LAC CHIN/ABRASION 12YOF CHEEK/CONTU HAND(S): 6YOF OUT RIDING BIKE, W WOBBLY ON BIKE AND HIT FACE ON ROAD, ABRASION TO L CHEEK, CHIN & R HAND",
"DX KNEE SPRAIN/CONTU KNEE/HIGH BLD PRESS: 16YOM R KNEE PN AFTER TWISTING KNEE COMING DOWN F JUMP' DUR' BASKETBALL GAME, LANDED ON BENT KNEE",
"DX FX PHALANX FOOT: 36YOF STUBBED R GREAT TOE ON STAIRS, PN, SWELL' SUROUNDING R GREAT TOE")
str <- paste(str, collapse = '')
ages <- str_extract_all(str, "(\\d{1,2}[MY]O[MF])", simplify = TRUE)
Вывод:
> ages
[,1] [,2] [,3] [,4]
[1,] "12YOF" "6YOF" "16YOM" "36YOF"
Надеюсь, это поможет.