Добавление редких языков в Apache Solr - PullRequest
1 голос
/ 06 марта 2019

Мы хотели бы добавить поддержку филиппинского, лаосского, малазийского и вьетнамского языков в наш индекс Solr (Solr v4 и Solr v6) и будем рады получить подсказки о том, какой Tokenizer использовать.

Для лаосского языка Iобнаружил, что ICU-Tokenizer, кажется, поддерживает его, но я не смог найти никаких примеров конфигурации с правилами для Lao: https://lucene.apache.org/solr/guide/6_6/language-analysis.html#LanguageAnalysis-Hebrew_Lao_Myanmar_Khmer

Любая помощь будет более чем приветствоваться!Спасибо !!

...