Неполадки при чтении CSV-файла с использованием опции tm пакета DatasourceFrame в R - PullRequest
0 голосов
/ 24 сентября 2019

Мне нужно знать, как настроить файл CSV, чтобы я мог загрузить его, используя опцию DataframeSource с пакетом tm

У меня есть существующий файл CSV "Practic.orig", который я хочу превратить вкорпус с использованием пакета тм.Я могу успешно загрузить его как фрейм данных, но как только я пытаюсь использовать опцию DataframeSource, чтобы превратить его в корпус, я получаю сообщение об ошибке.Я знаю, что эта опция требует, чтобы первые два столбца были названы «doc_id» и «text».Исходя из ошибки, я подозреваю, что проблема связана с именами столбцов в моем CSV-документе - я изменяю имена столбцов по умолчанию в Excel с «A» и «B», но как только я сохраняю документ в виде CSV-файла, любое имя изменяется.Сделано, чтобы заголовки столбцов были стерты.

tmd1 <- data.frame("practice.orig")
ex_data_tm1 <- DataframeSource(tmd1)
Error in DataframeSource(tmd1) : 
  all(!is.na(match(c("doc_id", "text"), names(x)))) is not TRUE
...