Удаление стоп-слов из большого корпуса в RStudio - PullRequest
0 голосов
/ 12 мая 2018

Я пытаюсь убрать текст из большого корпуса и у меня возникают проблемы с удалением стоп-слов.Когда я запускаю код myCorpus <- tm_map(myCorpus, removeWords, stopwords("en")), небольшой знак остановки в консоли продолжает работать и никогда не дает мне результата.Я пытался позволить ему работать в течение многих часов, но это все равно не дает мне результата.

Я пытался как перезапустить мой R, так и запустить код в меньшем корпусе, но он не дает результатов.Кто-нибудь из вас испытывал это раньше и сейчас, как заставить код работать?

Вот что я сделал до сих пор:

myCorpus <- Corpus(VectorSource(c(Delta_2,British_2,American_2)))

myCorpus <- tm_map(myCorpus, content_transformer(tolower))

myCorpus <- tm_map(myCorpus, removeWords, stopwords("en")) 
...