stopwords (из пакета tm) возвращает различные виды стоп-слов с поддержкой разных языков. Например,
stopwords
tm
stopwords()
возвращает 175 английских sh стоп-слов. Я хотел бы знать, есть ли некоторые инструменты, которые предоставляют больше стоп-слов.
Если вы используете пакет stopwords, вы можете указать источник с более длинным списком.
> install.packages("stopwords") > library("stopwords") > SW = stopwords("en", source = "stopwords-iso") > length(SW) 1298