Как удалить персонажа из стандартного токенизатора Solr? - PullRequest
1 голос
/ 13 мая 2019

У меня есть новый индекс SOLR, в котором стандартный токенизатор отлично работает.

Существует один новый вариант использования, в котором мы хотим, чтобы он не разбивался на дефисы, и мы хотим иметь возможность индексировать и искать en-us, но в настоящее время он разделяется дефисом.

Мы используем

<tokenizer class="solr.StandardTokenizerFactory" />
<filter class="solr.LowerCaseFilterFactory"/>
<filter class="solr.LengthFilterFactory" min="3" max="30"/>

Есть ли способ:

A) Включите в стандартный токенизатор дефисы,или

B) Воссоздать стандартный токенизатор с другими правилами?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...