Я импортировал несколько файлов .txt (тексты, написанные на испанском sh) в RStudio, используя следующий код:
content = readLines(paste("my_texts", "text1",sep = "/"))
Однако, когда я читаю тексты в RStudio, они содержат коды вместо диакритические знаки. Например, я вижу код <97> вместо «ó» или код <96> вместо «ñ».
Я также понял, что если файл .txt изначально был написан с использованием компьютера, настроенного на испанском языке sh, я не вижу кодов, но вижу настоящие диакритические знаки. И если тексты были написаны с использованием компьютера, настроенного на Engli sh, то я получаю коды (хотя при открытии файла .txt в TextEdit я вижу диакритические знаки).
Я не знаю, почему R отображает эти символы и что я могу сделать, чтобы сохранить диакритические знаки, которые я вижу в исходных файлах .txt.
Я читал, что могу решить эту проблему, изменив кодировку на UTF-8, поэтому я попробовал следующее:
content = readLines(paste("my_texts", "text1",sep = "/"), encoding = "UTF-8")
Но это не сработало. Есть идеи, что это за коды и как сохранить диакритические знаки?