Как бороться с "text_field должен ссылаться на столбец символьного режима"? - PullRequest
0 голосов
/ 06 ноября 2019

Я просто пытался преобразовать свой фрейм данных в корпус (очень нормальная процедура), когда возникла следующая ошибка: Ошибка в corpus.data.frame (df, text_field = "Text"): text_field должно ссылатьсяв столбец символьного режима . Мой фрейм данных - обычный с указанными столбцами ( Дата и Текст ). Единственная «новая» вещь, которую я сделал по сравнению с прошлым, это то, что я читал тексты из текстовых файлов, и при попытке прочитать один документ я получил это Ошибка в nchar (lev, "w"): недопустимая многобайтовая строка, элемент198 , только потому, что были некоторые символы, которые R не мог прочитать.

#Read the data from the folder

file.list <- list.files(pattern = '*.txt')

df.list <- lapply(file.list, read_file)

#Convert to a dataframe

df <- do.call(rbind.data.frame, df.list)

colnames(df) <- c("Text")

#Create the Corpus

cp <- corpus(df, text_field = "Text")

Фрейм данных выглядит так:


          Date               Text

1   5 January 2000             Text
2   3 February 2000              Text
3   2 March 2000                 Text
4   30 March 2000               Text
5   13 April 2000               text    
6   11 May 2000 

Я понятия не имею, что делать сЭто. Может кто-нибудь помочь мне? Большое спасибо

...