Как сохранить кодировку UTF-8 при использовании чтения CSV в R? - PullRequest
0 голосов
/ 25 марта 2020

Я столкнулся с проблемой потери кодировки файлов UTF - 8 при использовании

read.csv

в R. Это привело к тому, что, например, латинские буквы были заменены на нежелательные знаки, например: Iguaçu.

Я попытался использовать следующее с аргументом FileEncoding:

read.csv(xx.csv, fileEncoding = 'UTF-8')
read.csv2(xx.csv, fileEncoding = 'UTF-8')

, но получил ошибку:

Warning messages:1: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  invalid input found on input connection 'C:/xxx.csv'
2: In read.table(file = file, header = header, sep = sep, quote = quote,  :
  incomplete final line found by readTableHeader on 'C:/xxx.csv'

Какое решение сохранить кодировку UTF-8 при чтении CSV в R?

1 Ответ

0 голосов
/ 25 марта 2020

Итак, методом проб и ошибок я обнаружил, что работает функция из пакета readr

read_csv

вместо

read.csv
read.csv2

без аргумента fileEncoding, и кодирование выполняется сохраняется. Надеюсь, что это может кому-то помочь.

...