Question

У меня есть японский текстовый CSV-файл, разделенный табуляцией. Он был написан в utf-8 с использованием пакета Python CSV. Однако, когда я импортирую его с помощью команды в RStudio, как показано ниже

A <- read.csv("reviews4.csv",sep="\t",header = F,encoding="UTF-8")

Японский символ будет отображатьсякак это:

<U+8AAC>明無<U+3057><U+306B><U+5185>容量<U.....

Я думаю, что это правильно показывает только части кандзи.

Я пробовал кодирование = "CP932" Это будет показывать: 隤祆 <98>  <81>86 <86>  87 <87>  <.... </p>

Затем я попробовал другой способ: щелкните файл в правом нижнем углу и выберите «Импорт набора данных». Затем происходят странные вещи: когда я выбираю »Первые строки как имена ", названия столбцов правильно отображают японский язык, но когда я его отключаю, они отображаются некорректно.

enter image description here Может ли кто-нибудь помочь мне правильно импортировать японский csv?Большое вам спасибо!

читать японский персонаж в R Studio

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

читать японский персонаж в R Studio

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы