Читать многоязычные данные - PullRequest
0 голосов
/ 06 июля 2018

Я пытаюсь прочитать данные, в которых есть несколько текстовых данных на одном языке.

При чтении на R я использую приведенный ниже синтаксис.

Sys.setlocale(category="LC_ALL", locale = "Japanese")
df <- read.csv(file = "Japanese.csv",  encoding = "UTF-8",header=T,na.strings=c(""))

если файл содержит японский текст, я могу правильно прочитать японский символ, но скрипт не может прочитать китайский символ. Я получаю ниже, когда я пытаюсь просмотреть данные в R вместо текста на китайском языке.

<U+95EE><U+9898> 

Может ли кто-нибудь помочь, если мы можем читать данные, имеющие более двух языковых текстовых данных.

Ниже приведены примеры данных, которые я использую

Num Group   Text
1   Group1  パスワードの問題
2   Group1  ログインに関する問題
3   Group2  システムに関する問題
4   Group2  问题与内存
5   Group3  问题与登录
6   Group3  与系统问题

1 Ответ

0 голосов
/ 06 июля 2018

Пожалуйста, попробуйте ниже - извините, у вас нет текста на японском языке, чтобы проверить его.

   df<- read.csv("your_file.csv", fileEncoding="cp932")
...