Я хочу удалить нечисловые символы в определенных скобках и удалить другие скобки в этой строке. Ниже приведен пример:
text <- c("1110383 Project something 11/22/2019 (WSO) (89021-design)
John Doe (John.Doe@company22.com)",
"1110383 Project something 11/22/2019 ASP (890212-wso)
John Doe (John.Doe@company22.com)
Other Stuff",
"1110383 Project something SD (890212)
John Doe (John.Doe@company22.com)")
Ожидаемый результат будет:
cat(paste0(myoutxt, collapse = "\n"))
# 1110383 Project something 11/22/2019 WSO (89021)
# John Doe (John.Doe@company22.com)
# 1110383 Project something 11/22/2019 ASP (890212)
# John Doe (John.Doe@company22.com)
# 1110383 Project something SD (890212)
# John Doe (John.Doe@company22.com)
Я нашел регулярное выражение, соответствующее моему 5 или 6-значному номеру, но я не уверенкакая должна быть замена. Также я думаю, что следующее должно быть изменено, так как оно не учитывает возможное присутствие других скобок для их удаления.
^.*?\\([^\\d]*(\\d{5,6})[^\\d]*\\).*$
Логика:
По сути, яищем строку с 5-6-значным числом (например, 89021
или 890212
) между скобками. Затем, если в скобках есть другие элементы, я хочу их удалить (например, -design
или -wso
). И, наконец, если в этой конкретной строке есть другие скобки (например, (WSO)
), я хочу удалить скобки, а не слово.