Проблема с кодировкой Readlines (), спецсимвол - PullRequest
0 голосов
/ 13 марта 2019

У меня есть некоторые акценты в моем файле, и я пытаюсь открыть этот файл с правильной кодировкой, но каждый раз, когда я открываю этот файл, мои акценты появляются со специальными символами (), хотя я упоминал, чтобы открыть файл с кодировкой = UTF-8

mes_keywords_to_check <- readLines("mot cle holidays.txt", encoding='UTF-8')

Знаете ли вы, в чем проблема?

1 Ответ

0 голосов
/ 13 марта 2019

Я могу воспроизвести вашу проблему:

temp <- tempfile(fileext = ".txt")

write("Ole Gunnar Solskjær", temp)

readLines(temp, encoding = "UTF-8")

[1] "Ole Gunnar Solskj\xe6r"

Однако в моем случае это разрешается путем пропуска параметра кодирования в readLines (или использования latin1 вместо UTF-8):

readLines(temp)
[1] "Ole Gunnar Solskjær"

readLines(temp, encoding = "latin1")
[1] "Ole Gunnar Solskjær"
...