Мне нужно знать, как настроить файл CSV, чтобы я мог загрузить его, используя опцию DataframeSource с пакетом tm
У меня есть существующий файл CSV "Practic.orig", который я хочу превратить вкорпус с использованием пакета тм.Я могу успешно загрузить его как фрейм данных, но как только я пытаюсь использовать опцию DataframeSource, чтобы превратить его в корпус, я получаю сообщение об ошибке.Я знаю, что эта опция требует, чтобы первые два столбца были названы «doc_id» и «text».Исходя из ошибки, я подозреваю, что проблема связана с именами столбцов в моем CSV-документе - я изменяю имена столбцов по умолчанию в Excel с «A» и «B», но как только я сохраняю документ в виде CSV-файла, любое имя изменяется.Сделано, чтобы заголовки столбцов были стерты.
tmd1 <- data.frame("practice.orig")
ex_data_tm1 <- DataframeSource(tmd1)
Error in DataframeSource(tmd1) :
all(!is.na(match(c("doc_id", "text"), names(x)))) is not TRUE