Я думаю, что вы не должны пытаться полностью избавиться от этих фраз, потому что они раскрывают намерения искателя. Вы можете попытаться использовать их, используя систему ответов на вопросы на естественном языке, такую как Ephyra . Есть даже проект , нацеленный на его интеграцию с Lucene. Я не использовал это сам, но, по крайней мере, оценивая это
стоит попробовать.
Если вы полны решимости удалить их, то я думаю, что вам нужно написать пользовательский QueryParser , который будет фильтровать запрос, делегируя дальнейшую обработку анализатору по вашему выбору.