Р: Заменить все знаки препинания обычными буквами. - PullRequest
3 голосов
/ 17 мая 2011

Я ищу простой способ заменить все знаки препинания обычными буквами. Например, я хочу изменить föó на foo. Я могу сделать это так:

gsub("ö|ó","o","föó")

однако, вероятно, будет много ручной работы, чтобы сделать это для каждого возможного пунктуированного письма Есть ли способ сделать это автоматически?

1 Ответ

9 голосов
/ 17 мая 2011

Вы можете попробовать несколько вариантов этого:

    cleanString <- function(x){
        tmp <- iconv(x, from="UTF8", to ="ASCII//TRANSLIT")
        gsub("[^[:alpha:]]", "", tmp)
        }

x = "föó"

cleanString(x)

[1] "foo"

идея использования iconv из Удаление диакритических знаков из строки

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...