У меня есть текстовый корпус, содержащий некоторые нецензурные слова, и я попытался подвергнуть их цензуре, но после дальнейшей проверки я понял, что регулярное выражение, которое я использовал, еще не совсем подходит, а также правильные слова подвергаются цензуре из-за этого.
x <- c("ass", "badass", "class")
gsub("ass\\b", "a*s", x)
это вернет первые два слова, правильно прошедшие цензуру, и «cla * s», но, очевидно, я хочу оставить «класс». Что мне нужно добавить в регулярное выражение, чтобы изменить это? Я попробовал "\ w \". но это не сработало.