Я очистил текст и преобразовал в TDM. Результат TDM показал мне 1 Doc и 1 Term. Полагаю, это не имеет смысла
Я пытался изменить масштаб для wordcloud, но понял, что это очень важно для конвертациив TDM.
library(NLP)
library(tm)
essay <- "sukjin_essay_summary.txt"
essay_2 <- Corpus(VectorSource(essay))
#Data Cleaning
essay_data <- tm_map(essay_2, stripWhitespace)
essay_data <- tm_map(essay_data, tolower)
essay_data <- tm_map(essay_data, removeNumbers)
essay_data <- tm_map(essay_data, removePunctuation)
essay_data <- tm_map(essay_data, removeWords, stopwords("english"))
#create term document matrix
tdm_essay <- TermDocumentMatrix(essay_data) #create TDM
TDM <- as.matrix(tdm_essay)
TDM
Docs
Terms 1
sukjinessaysummarytxt 1
Я ожидал, что у меня будет 1 документ и ххх термины, но это только 1 документ и 1 термин.
Исходя из вышеизложенного, мой код для wordcloud говорит мне, что он может 'т быть в заговоре.