Остановить удаление слов в Javascript - PullRequest
3 голосов
/ 12 апреля 2011

HI Я ищу библиотеку, которая удалит стоп-слова из текста в Javascript, моя конечная цель - вычислить tf-idf, а затем преобразовать данный документ в векторное пространство, и все это Javascript , Может кто-нибудь указать мне библиотеку, которая поможет мне сделать это. Просто библиотека для удаления стоп-слов также будет здорово.

Ответы [ 3 ]

4 голосов
/ 13 апреля 2011

Я думаю, что нет библиотек для таких мыслей, вам нужно скачать эти слова http://www.ranks.nl/resources/stopwords.html. И затем заменить, как написано в комментариях text = text.replace (stopword, "")

0 голосов
/ 02 февраля 2017

Вот массив с английскими стоп-словами. Надеюсь, поможет. С http://www.ranks.nl/stopwords (упомянуто в предыдущем ответе).

Кроме того, это может быть полезным ресурсом для вас.

https://github.com/shiffman/A2Z-F16/tree/gh-pages/week5-analysis

http://shiffman.net/a2z/text-analysis/

var stopwords = ["a", "about", "выше", "after", "again", "против", "all", "am", "an", "and", "any" , «являются», «не», «как», «в», «быть», «потому что», «был», «перед», «быть», «ниже», «между», «как» , «но», «на», «не могу», «не могу», «может», «не мог», «сделал», «не», «делать», «делает», "Безразлично» т»,„делать“,„не“,„вниз“,„во время“,„каждый“,„мало“,„за“,„с“,„далее“,„у“,„не имел“ , «имеет», «не», «есть», «не», «имеющий», «он», «бы он», «он», «он», «она»,» здесь»,„вот“,„ее“,„сама“,„он“,„сам“,„его“,„как“,„как это“,„я“,„я“,„я буду“ , «я», «я», «если», «в», «в», «есть», «не», «он», «она», «его», «сам по себе» , «давайте», «мне», «больше», «самый», «не должен», «мой», «я», «нет», «ни», «не», «из», «выключено» , "на", "когда", "только", "или", "другой", "должен", "наш", "наш", "себя", "вне", "над", "собственный",» то же самое»,„не буду“,„она“,„она“,„она тебе“,„она“,„следует“,„не должен“,„так“,„некоторые“,„такие“ , «чем», «что», «это», «в», «их», «чужой», «их», «сами», «потом», «там», «есть», «они»,» они «„они“,„они будут“,„они“,„у них есть“,„это“,» Thos е»,„через“,„к“,„слишком“,„под“,„пока“,„вверх“,„очень“,„не было“,„не“,„мы“,„мы бы“ , «мы будем», «мы», «мы в», «были», «не», «что», «что», «когда», «когда будет», «где»,» где это»,„который“,„а“,„кто“,„кто“,„кому“,„почему“,„почему это“,„с“,„не будет“,„будет“,„не будет“ , "ты", "вы бы", "вы будете", "ты", "вы имеете", "ваш", "твой", "себя", "себя"];

0 голосов
/ 14 февраля 2013

Здесь есть библиотека Javascript для удаления стоп-слов: http://geeklad.com/remove-stop-words-in-javascript

...