У меня есть японский текстовый CSV-файл, разделенный табуляцией. Он был написан в utf-8 с использованием пакета Python CSV. Однако, когда я импортирую его с помощью команды в RStudio, как показано ниже
A <- read.csv("reviews4.csv",sep="\t",header = F,encoding="UTF-8")
Японский символ будет отображатьсякак это:
<U+8AAC>明無<U+3057><U+306B><U+5185>容量<U.....
Я думаю, что это правильно показывает только части кандзи.
Я пробовал кодирование = "CP932" Это будет показывать: 隤 祆 <98> <81>86 <86> 87 <87> <.... </p>
Затем я попробовал другой способ: щелкните файл в правом нижнем углу и выберите «Импорт набора данных». Затем происходят странные вещи: когда я выбираю »Первые строки как имена ", названия столбцов правильно отображают японский язык, но когда я его отключаю, они отображаются некорректно.
Может ли кто-нибудь помочь мне правильно импортировать японский csv?Большое вам спасибо!