ErFun He 01 июня 2018 38

удаление стоп-слов из корпуса в R происходит слишком медленно

ErFun He / 01 июня 2018

Я загрузил свой корпус, который содержит 16 текстовых файлов, но для удаления стоп-слов из этого корпуса потребовалось около 2 часов.общий размер корпуса составляет 31 МБ.Вы знаете, как я могу решить эту проблему?

multidocMBTI <- Corpus(DirSource("F:/my master course/Principle of analytics/DATA03"))
multidocMBTI <- tm_map(multidocMBTI, removeWords, stopwords("english"))

...

удаление стоп-слов из корпуса в R происходит слишком медленно

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

удаление стоп-слов из корпуса в R происходит слишком медленно

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Похожие темы