R по-разному обрабатывает некоторые символы при установке с помощью apt / compiled from source - PullRequest
0 голосов
/ 27 ноября 2018

R 3.4.4 из репозиториев Ubuntu:

> "µV"
[1] "\302\265V"

Тот же компьютер, R 3.4.4 (а также 3.2.0, а также 3.5.1), скомпилированный из источников, полученных из CRAN:

> "µV"
[1] "µV"

Я бы предпочел второе поведение.Откуда берется эта разница?

Encoding("µV") возвращает "unknown" в первом случае и "UTF-8" во втором случае, но установка кодировки строковой переменной вручную, похоже, не улучшает ее представление.

1 Ответ

0 голосов
/ 27 ноября 2018

По какой-то причине Sys.getencoding() отличался в этих двух сборках.Запуск Sys.setlocale("LC_COLLATE", "en_US.UTF-8") в первой сборке, похоже, устранил проблему.

...