Я хочу использовать пакет R 'tm' для некоторого анализа текста.Я хочу добавить некоторые специальные символы в стоп-слова.
stop3<-c("()","(3):","article","..","etal.","fig.","natgenet","artical","articleinitiallypublished")
reuters <- tm_map(reuters, removeWords, c(stopwords("english"),stop3))
dtm <- DocumentTermMatrix(reuters)
findFreqTerms(dtm, 20)
Однако я нашел (), этал.и (): нельзя удалить из Reuters.Кто-нибудь знает, что случилось?
Спасибо
это то, что я вернулся, когда я использую findFreqTerms
findFreqTerms(dtm, 20)
[1] "()." "():" "etal." "found" "htmlpdfversions" "show"