Для каждого встроенного языкового анализатора есть пример того, как его перестроить. Для danish
есть такой пример:
PUT /danish_example
{
"settings": {
"analysis": {
"filter": {
"danish_stop": {
"type": "stop",
"stopwords": "_danish_"
},
"danish_keywords": {
"type": "keyword_marker",
"keywords": ["eksempel"]
},
"danish_stemmer": {
"type": "stemmer",
"language": "danish"
}
},
"analyzer": {
"rebuilt_danish": {
"tokenizer": "standard",
"filter": [
"lowercase",
"danish_stop",
"danish_keywords",
"danish_stemmer"
]
}
}
}
}
}
Это, по сути, создание собственного пользовательского анализатора .
Список доступных стеммеров можно найти здесь . Список доступных предварительно составленных списков стоп-слов можно найти здесь .
Надеюсь, это поможет!