В основном я работаю над Drupal и использую Solr в качестве поисковой системы. Он ищет некоторые из упрощенных китайских слов / символов, а некоторые не такие, как показано ниже
美国: 为 美 朝 峰会 同 朝鲜 进行 的 磋商 取得 进展
Это не поиск простого персонажа.
Итак, я прошел оба
https://lucene.apache.org/solr/guide/7_4/language-analysis.html
http://www.opencms -wiki.org / вики / Solr _-_ configuration_for_Chinese_and_correct_results_for_german_umlauts
& в конфигурационном файле solr у меня ниже
<fieldType name="text_chinese" class="solr.TextField">
<analyzer class="org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer"/>
<analyzer>
<tokenizer class="solr.HMMChineseTokenizerFactory"/>
<filter class="solr.CJKWidthFilterFactory"/>
<filter class="solr.StopFilterFactory"
words="org/apache/lucene/analysis/cn/smart/stopwords.txt"/>
<filter class="solr.PorterStemFilterFactory"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
Это дает
Местное время:
org.apache.solr.common.SolrException: org.apache.solr.common.SolrException:
Не удалось загрузить conf для ядра local: Ошибка инициализации плагина для
[schema.xml] fieldType "text_chinese": не удается загрузить анализатор:
org.apache.lucene.analysis.cn.smart.SmartChineseAnalyzer. Файл схемы
is /var/solr/cores/local/conf/schema.xml
все же это не дает результата.
Не уверен, если что-то упущено в конфигурации.