Есть ли список наиболее распространенных английских слов для индексации текста для поиска? - PullRequest
3 голосов
/ 11 февраля 2010

Существует ли бесплатный список наиболее распространенных английских слов для удаления из текста для создания поискового индекса?

Ответы [ 2 ]

2 голосов
/ 11 февраля 2010

Здесь - это те (плюс символы), которые используются в списке новостных слов SQL Server 05, я предполагаю, что 08 стоп-слов симулированы.

И MSDN на нем здесь

Надеюсь, это поможет

2 голосов
/ 11 февраля 2010

Википедия дает 100 самых частых лемм: http://en.wikipedia.org/wiki/Most_common_words_in_English

Это может быть хорошо для начала; статья содержит несколько хороших ссылок.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...