Что `format` делает со строками UTF-8? - PullRequest
0 голосов
/ 18 октября 2019

Из документации format следует сделать следующее:

Форматировать объект R для красивой печати. ​​

Теперь, как это происходит вместе со следующимпример:

> format("\u2264")
[1] "="

Кто-нибудь может объяснить, что происходит?

РЕДАКТИРОВАТЬ:

Я использую R на Windows. Проблема появляется в R 3.3, 3.4 и 3.5. Проблема не появляется в Linux.

1 Ответ

0 голосов
/ 18 октября 2019

Из документации R для format:

[возвращает] Объект, аналогичный структуре x, содержащий символьные представления элементов первого аргумента x вобщий формат и (выделение мое) в кодировке текущей локали .

Вы можете попробовать запустить Sys.getenv("LANG"), чтобы увидеть текущую кодировку среды R. Предполагая, что это UTF-8, тогда имеет смысл видеть , так как это представление UTF-8 литерала Unicode \u2264.

Примечание: я получаю в качестве вывода для format("\u2264") в моем инструменте R, который является правильным по сравнению с таблицами Unicode. Возможно, у вас есть опечатка в вашем вопросе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...