Почему я получаю сообщение об ошибке в DocumentTerm Matrix в R даже после использования content_transformer для tolower в функции tm_map? - PullRequest
0 голосов
/ 10 марта 2019

Я прошел здесь много ответов и попытался использовать все предложения, представленные в stackoverflow, но, похоже, у меня ничего не работает.Есть ли порядок перед созданием матрицы терминов документа с использованием пакета tm в R?

email_corpus <- VCorpus(VectorSource(df2$final_text))

email_corpus_clean <- tm_map(email_corpus,content_transformer(tolower))     

#remove special characters

for(j in seq(email_corpus_clean))  {        

email_corpus_clean[[j]] <- gsub("\n", " ", email_corpus_clean[[j]]) 
email_corpus_clean[[j]] <- gsub("\r", " ", email_corpus_clean[[j]])        
email_corpus_clean[[j]] <- gsub(">>", " ", email_corpus_clean[[j]])     

}


email_corpus_clean <- tm_map(email_corpus_clean,removeNumbers)        

myStopWords<- c("said","from","what")

email_corpus_clean <- tm_map(email_corpus_clean, removeWords, c(stopwords("english"), myStopWords))    

email_corpus_clean <- tm_map(email_corpus_clean, removePunctuation)   

email_corpus_clean <- tm_map(email_corpus_clean, stemDocument)   

email_corpus_clean <- tm_map(email_corpus_clean,stripWhitespace)  

#This is the line of code , where i get error 

email_dtm <- DocumentTermMatrix(email_corpus_clean)   #creating document term matrix


# this is the error 

Error in UseMethod("meta", x) : 
no applicable method for 'meta' applied to an object of class "character"
...