Как получить необработанное числовое HTML-представление специальных символов? - PullRequest
3 голосов
/ 27 марта 2019

Когда я набираю "\xfc" в R, это приводит к [1] "ü".Я не хочу этого, я хочу, чтобы это привело к [1] "\xfc".Я также не очень понимаю, почему Encoding("\xfc") равно "latin1", хотя я изменил настройки в Code-> Saving to UTF-8.Я хочу написать функцию, которая заменяет некоторые специальные символы, такие как "ü" на "\xfc", но я не могу этого достичь:

> stringr::str_replace_all("Müller", "ü", "\xfc")
[1] "Müller"
> stringr::str_replace_all("Müller", "ü", "\\xfc")
[1] "Mxfcller"
> stringr::str_replace_all("Müller", "ü", "\\\xfc")
[1] "Müller"
> stringr::str_replace_all("Müller", "ü", "\\\\xfc")
[1] "M\\xfcller"

Что я действительно хочу, это [1] "M\xfcller"

(Как) я могу достичь этого?

1 Ответ

0 голосов
/ 27 марта 2019

Последняя строка дает желаемый результат.Обратная косая черта экранируется при печати строки.Чтобы убедиться в этом, давайте сохраним строку в файл, а затем просмотрим содержимое файла.


s <- stringr::str_replace_all("Müller", "ü", "\\\\xfc")

writeLines(s, "test.txt")

cat(readLines("test.txt"))
#> M\xfcller

Создано в 2019-03-27 пакетом Представления (v0.2.1)

Также смотрите этот выпуск GitHub: https://github.com/STAT545-UBC/Discussion/issues/394

...