Да, используя стеммер, такой как Snowball, вы теряете информацию об оригинальной форме вашего текста. Иногда это будет полезно, иногда нет.
Например, Snowball превратит «организацию» в «орган», поэтому при поиске «организации» результаты будут возвращаться с «органом» без штрафа за подсчет очков.
То, подходит ли вам это, зависит от вашего контента и от типа запросов, которые вы поддерживаете (например, являются ли поиски очень простыми или очень сложными и используют ваш поиск для точной фильтрации результатов) ). Вы также можете посмотреть на менее агрессивные стеммеры, такие как KStem .