Можно ли преобразовать код UTF-8 в правильные символы в R? - PullRequest
1 голос
/ 03 апреля 2020

Я перебираю данные в сети, чтобы я мог собирать только кодовые имена символов UTF-8. Я знаю, что существуют пакеты для преобразования обычных символьных векторов в код UTF-8. Но есть ли пакеты для преобразования кода UTF-8 в правильные символы?

Так, например, у меня есть

%22%E2%80%93 This isn%27t desirable%21 %E2%80%93%22

Когда я хочу

"– This isn't desirable! –"

1 Ответ

4 голосов
/ 03 апреля 2020

Ваши строки URL в кодировке . Эту кодировку можно отменить с помощью функции URLdecode :

> z <- URLdecode("%22%E2%80%93 This isn%27t desirable%21 %E2%80%93%22")
> cat(z)
"– This isn't desirable! –"
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...