Существует ли бесплатный список наиболее распространенных английских слов для удаления из текста для создания поискового индекса?
Здесь - это те (плюс символы), которые используются в списке новостных слов SQL Server 05, я предполагаю, что 08 стоп-слов симулированы.
И MSDN на нем здесь
Надеюсь, это поможет
Википедия дает 100 самых частых лемм: http://en.wikipedia.org/wiki/Most_common_words_in_English
Это может быть хорошо для начала; статья содержит несколько хороших ссылок.