Я являюсь автором HebMorph.
StopWords действительно поддерживаются, но вам нужно отфильтровать их до того, как включится лемматизатор. Предполагая недавнюю версию HebMorph - ваш фильтр стоп-слов должен войти правильнопосле токенизатора, что означает, что он должен позаботиться и о буквах בחל"מ, прикрепленных к стоп-словам.
В настоящее время общий совет для всех языков - НЕ опускать стоп-слова - по крайней мере, не при индексации., поэтому я бы рекомендовал не применять здесь фильтр стоп-слов.
Что касается синонимов - основная проблема заключается в том, что лемматизатор HebMorph расширяет слово до нескольких лемм, что делает работу по применениюСинонимы немного сложнее. С (относительно) новыми анализаторами на основе графиков это теперь возможно сделать, поэтому мы, вероятно, также осуществим это, и фильтры синонимов Lucene будут поддерживаться OOTB.
В коммерческой версии уже естьспособ настроить списки слов и переопределить определения словаря, которыеch полезен в неоднозначном языке, таком как иврит.Многие используют это как способ создания синонимов.