R не распознает арабский язык - PullRequest
0 голосов
/ 16 апреля 2019

Я работаю с данными на арабском языке в R, поэтому я установил локальный арабский как показано здесь Sys.setlocale("LC_CTYPE","arabic").

, затем я открыл данные и присвоил их переменной, и я могу их прочитатьтак ясно, но когда я справился с этим, результат на панели консоли становится символом, который не может понять это так

ظ…ط¨ط§ظ„ط؛ ظپظٹظ‡ط§.

я впервые столкнулся с этой проблемой, помогая

1 Ответ

0 голосов
/ 17 апреля 2019

Я думаю, что "арабский" не является правильным языком, поэтому вы не можете установить его как LC_CYPE.

Обычный формат: en_US.UTF-8, поэтому язык, страна / территория, а теперь довольно стандартный суффикс .UTF-8 или UTF8 для указания кодировки.

Вы должны использовать locale -a на терминале, чтобы найти локаль, доступную на вашем компьютере. Прочтите документацию вашей операционной системы, о том, как добавить новые локали (и в https://superuser.com/ для Windows, https://unix.stackexchange.com/ для Unix и Linux (Ubuntu также имеет собственный сайт обмена стека) или https://apple.stackexchange.com/ для MacO.

Но я думаю, что вы неверно истолковываете язык. Локаль о том, как система должна взаимодействовать с вами. Речь идет не о данных, которые вы используете. Но для сортировки (R использует локаль) и отображения.

...