Если вы хотите заменить эти термины в круглых скобках, содержащие хотя бы одно число, тогда sub
- это хороший базовый вариант R:
text
sapply(text, function (x) {
gsub("\\([^()]*\\d[^()]*\\)", "REMOVED", x)
})
[1] "Sekretär (dipl.) (G3)" "Zolldeklarant (3 Jahre)" "Grenzwächter (< 2 Jahre)"
[1] "Sekretär (dipl.) REMOVED" "Zolldeklarant REMOVED" "Grenzwächter REMOVED"
Я заменил натекст REMOVED
в качестве заполнителя для отображения замены.
Редактировать:
Если вы хотите извлечь эти термины, мы также можем использовать sub
для этого:
sapply(text, function (x) {
gsub(".*(\\([^()]*\\d[^()]*\\)).*", "\\1", x)
})
[1] "(G3)" "(3 Jahre)" "(< 2 Jahre)"
Здесь мы фиксируем термин в скобках, а затем заменяем всю строку только первой (и единственной) группой захвата \\1
.