Мне интересно, как я могу заменить точки [.
] при индексации данных в solr.
За исключением , я хочу сохранить слова, начинающиеся с определенных фраз, как целые токены.
Например,
word.phrase
следует индексировать как два ключевых слова: word
, phrase
Но я хочу, чтобы что-либо с префиксом item.
не делилось на периоды, чтобы:
item.name
должно быть проиндексировано как одно ключевое слово: item.name
Я пробую эти фильтры / токенизаторы, но все еще не повезло, и я думаю, что мое регулярное выражение является виновником:
<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<charFilter class="solr.PatternReplaceCharFilterFactory"
pattern="[^(item)]\." replacement=" " />
<tokenizer class="solr.StandardTokenizerFactory"/>
</analyzer>
</fieldType>