Как убрать пунктуацию внутри скобок в R - PullRequest
0 голосов
/ 13 ноября 2018

Я пытался разбить документы на предложения, но есть некоторые странные результаты из-за пунктуации внутри скобок.Поэтому я хотел бы удалить любые знаки препинания.

пример ввода:

A <- c('How to remove all punctuations(like this?) in side it?')

требуемый вывод:

"How to remove all punctuations(like this) in side it?"

1 Ответ

0 голосов
/ 13 ноября 2018

Может быть, что-то подобное, используя позитивный взгляд?

gsub("[?!;,.](?=\\))", "", A, perl = T)
#[1] "How to remove all punctuations(like this) in side it?"

Или используя классы символов POSIX

gsub("[[:punct:]](?=\\))", "", A, perl = T)

Или, если вам нужно сопоставить другие типы закрывающих скобок (например, фигурные, квадратные)

gsub("[[:punct:]](?=[)\\]}])", "", A, perl = T)
...