удаление стоп-слов из корпуса в R происходит слишком медленно - PullRequest
0 голосов
/ 01 июня 2018

Я загрузил свой корпус, который содержит 16 текстовых файлов, но для удаления стоп-слов из этого корпуса потребовалось около 2 часов.общий размер корпуса составляет 31 МБ.Вы знаете, как я могу решить эту проблему?

multidocMBTI <- Corpus(DirSource("F:/my master course/Principle of analytics/DATA03"))
multidocMBTI <- tm_map(multidocMBTI, removeWords, stopwords("english"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...