Список стоп-слов для r - PullRequest
       18

Список стоп-слов для r

1 голос
/ 10 апреля 2020

stopwords (из пакета tm) возвращает различные виды стоп-слов с поддержкой разных языков. Например,

stopwords()

возвращает 175 английских sh стоп-слов. Я хотел бы знать, есть ли некоторые инструменты, которые предоставляют больше стоп-слов.

1 Ответ

1 голос
/ 10 апреля 2020

Если вы используете пакет stopwords, вы можете указать источник с более длинным списком.

> install.packages("stopwords")
> library("stopwords")
> SW = stopwords("en", source = "stopwords-iso")

> length(SW)
1298
...