Чтение файла с использованием кодировки текста EU C -KR в R - PullRequest
0 голосов
/ 03 апреля 2020

Кто-нибудь имел опыт чтения файла на корейском языке, используя EU C -KR в качестве кодировки текста?

Я использовал функцию fread, так как она отлично читает структуру этого файла. Ниже приведен пример кода:

test <- fread("KoreanTest.txt", encoding = "EUC-KR")

Затем я получил ошибку «Ошибка в fread (« KoreanTest.txt », encoding =« EU C -KR »): Аргумент« encoding »должен быть« unknown ',' UTF-8 'или' Latin-1 '".

Изначально я использовал UTF-8 в качестве кодировки текста, но выходные символы не отображались правильно на корейском языке. Я искал другое решение, но на данный момент ничего не работает.

Цените, если кто-то может поделиться идеями. Благодаря.

1 Ответ

1 голос
/ 03 апреля 2020

Это позволяет явный параметр кодирования. Это общее использование хорошо работает:

read.table(filesource, header = TRUE, stringsAsFactors = FALSE, encoding = "EUC-KR")

или вы можете попробовать с Rstudio

Файл -> Импорт набора данных -> Из текста

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...