Я бы хотел использовать gsub R для удаления всех знаков препинания из текста, кроме апострофов. Я довольно плохо знаком с регулярным выражением, но учусь.
Пример:
x <- "I like %$@to*&, chew;: gum, but don't like|}{[] bubble@#^)( gum!?"
gsub("[[:punct:]]", "", as.character(x))
Токовый выход (без апострофа) * 1009 *
[1] "I like to chew gum but dont like bubble gum"
Желаемый результат (я хочу, чтобы апостроф не остался)
[1] "I like to chew gum but don't like bubble gum"