Я просто пытался преобразовать свой фрейм данных в корпус (очень нормальная процедура), когда возникла следующая ошибка: Ошибка в corpus.data.frame (df, text_field = "Text"): text_field должно ссылатьсяв столбец символьного режима . Мой фрейм данных - обычный с указанными столбцами ( Дата и Текст ). Единственная «новая» вещь, которую я сделал по сравнению с прошлым, это то, что я читал тексты из текстовых файлов, и при попытке прочитать один документ я получил это Ошибка в nchar (lev, "w"): недопустимая многобайтовая строка, элемент198 , только потому, что были некоторые символы, которые R не мог прочитать.
#Read the data from the folder
file.list <- list.files(pattern = '*.txt')
df.list <- lapply(file.list, read_file)
#Convert to a dataframe
df <- do.call(rbind.data.frame, df.list)
colnames(df) <- c("Text")
#Create the Corpus
cp <- corpus(df, text_field = "Text")
Фрейм данных выглядит так:
Date Text
1 5 January 2000 Text
2 3 February 2000 Text
3 2 March 2000 Text
4 30 March 2000 Text
5 13 April 2000 text
6 11 May 2000
Я понятия не имею, что делать сЭто. Может кто-нибудь помочь мне? Большое спасибо