У меня есть новый индекс SOLR, в котором стандартный токенизатор отлично работает.
Существует один новый вариант использования, в котором мы хотим, чтобы он не разбивался на дефисы, и мы хотим иметь возможность индексировать и искать en-us
, но в настоящее время он разделяется дефисом.
Мы используем
<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.LengthFilterFactory" min="3" max="30"/>
Есть ли способ:
A) Включите в стандартный токенизатор дефисы,или
B) Воссоздать стандартный токенизатор с другими правилами?