Преобразование корпуса в dataframe возвращает NA - PullRequest
1 голос
/ 20 октября 2019

Я пытаюсь преобразовать мой корпус обратно в массив данных, но он возвращает только NA. Пожалуйста, помогите

Код:

library(wordcloud)
df <- data.frame(Description = c("I like this service very much"," this is worth it so much"))

corpus <- Corpus(VectorSource(df$Description))

corpus <- tm_map(corpus, tolower)

corpus <- tm_map(corpus, removePunctuation)
corpus <- tm_map(corpus, removeWords, c(stopwords('english')))
corpus <- tm_map(corpus, stripWhitespace)
corpus <- tm_map(corpus, stemDocument)

#a <- as.data.frame(corpus)

dataframe<-data.frame(text=unlist(sapply(corpus, `[`, "content")), 
                      stringsAsFactors=F)

Ожидаемый результат:

датафрейм

'like servic much'
'worth much'

1 Ответ

0 голосов
/ 20 октября 2019

Этот код работает для меня:

dataframe <- data.frame(text = sapply(corpus, as.character), stringsAsFactors = FALSE)

Вывод:

              text
1 like servic much
2       worth much
...