читать японский персонаж в R Studio - PullRequest
0 голосов
/ 29 сентября 2018

У меня есть японский текстовый CSV-файл, разделенный табуляцией. Он был написан в utf-8 с использованием пакета Python CSV. Однако, когда я импортирую его с помощью команды в RStudio, как показано ниже

A <- read.csv("reviews4.csv",sep="\t",header = F,encoding="UTF-8")

Японский символ будет отображатьсякак это:

<U+8AAC>明無<U+3057><U+306B><U+5185>容量<U.....

Я думаю, что это правильно показывает только части кандзи.

Я пробовал кодирование = "CP932" Это будет показывать: 隤 祆 <98>  <81>86 <86>  87 <87>  <.... </p>

Затем я попробовал другой способ: щелкните файл в правом нижнем углу и выберите «Импорт набора данных». Затем происходят странные вещи: когда я выбираю »Первые строки как имена ", названия столбцов правильно отображают японский язык, но когда я его отключаю, они отображаются некорректно.

enter image description here Может ли кто-нибудь помочь мне правильно импортировать японский csv?Большое вам спасибо!

1 Ответ

0 голосов
/ 29 сентября 2018

Используйте fileEncoding = "UTF-8" вместо encoding = "UTF-8".

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...