Я использую грань solr, и я столкнулся с проблемой, которую я надеялся обойти, используя фильтры.
В принципе, иногда название города в SOLR появляется как
"КЕМБРИДЖ"
и когда-нибудь это произойдет как
"Кембридж"
Я хотел использовать фильтр в Solr, чтобы остановить версию города «Кричащие Крышки»название.Кажется, есть приспособление для создания всего текста в нижнем регистре .
<!-- A text field that only sorts out casing for faceting -->
<fieldType name="text_facet" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
Мне было интересно, знает ли кто-нибудь о фильтре, который будет игнорировать первый символ слова и применять строчные буквыостальным персонажам.Например,
- КЕМБРИДЖ >> Кембридж
- Кингстон-апон-Халл >> Кингстон-апон-Халл
и т. Д.
В качестве альтернативы, если его легко написатьваши собственные фильтры .. некоторая помощь о том, как это сделать, будет оценена по достоинству .. я не Java-человек ..
спасибо