R прочитайте .txt документ, имеющий кодировку «ANSI» (windows base), имеющий правильный Swedi sh символ - PullRequest
1 голос
/ 24 марта 2020

Я использую машину windows. У меня есть документ test.txt с кодировкой «ANSI», содержащей внутри символы Swedi sh. Я надеюсь, что смогу прочитать информацию R для дальнейшего анализа. Любое предложение?

текущее решение, которое у меня есть, мне нужно сохранить как документ .txt как новый документ с кодировкой utf_8, а затем использовать приведенный ниже код. Но хотелось бы, чтобы предложение могло прочитать 'ANSI 'в правильном формате напрямую. Спасибо!

документ выглядит так: enter image description here

формат документа: enter image description here

код работает, если я сохраняю .txt в формате 'utf-8'

dftxt <- readr::read_delim('./data/text_Briljant2.txt', 
                       delim = '\t', skip = 15,
                       locale = locale('se', encoding = 'UTF-8'),
                       col_names = F) %>% select(-c(X5, X6))

, кажется, что невозможно предоставить воспроизводимый образец. но если вы сообщите мне, где я могу загрузить файл, который я хотел бы предоставить.

Спасибо за любые предложения.

1 Ответ

0 голосов
/ 25 марта 2020
dftxt <- readr::read_delim('test.txt', 
                           delim = '\t', skip = 15,
                           locale = locale('se', encoding = 'ISO8859-1'),
                           col_names = F) %>%
  select(-c(X5, X6))
...