Создайте свой собственный анализатор, расширив WhiteSpaceAnalyzer и изменив метод tokenStream следующим образом.
public TokenStream tokenStream(String fieldName, Reader reader) {
TokenStream result = super.tokenStream(fieldName, reader);
result = new StopFilter(result, stopSet);
return result;
}
Здесь stopSet - это набор стоп-слов, который вы можете получить, добавив конструктор в ваш анализатор, который принимает список стоп-слов.
Вы также можете переопределить метод reusableTokenStream () аналогичным образом, если планируете повторно использовать TokenStream.