Выглядит как проблема в вашем пользовательском анализаторе, я создал свой собственный анализатор autocomplete
, который использует фильтры edge_ngram
и lowercase
, и он отлично работает для меня по вашему запросу, а возвращает мне точное совпадение сверху и вот как работает Elasticsearch, у точных совпадений всегда больше очков. , поэтому нет необходимости явно создавать другое поле и увеличивать его, поскольку Elasticsearch по умолчанию повышает точное совпадение при совпадении токенов.
Индекс по умолчанию
{
"settings": {
"analysis": {
"filter": {
"autocomplete_filter": {
"type": "edge_ngram",
"min_gram": 1,
"max_gram": 10
}
},
"analyzer": {
"autocomplete": {
"type": "custom",
"tokenizer": "standard",
"filter": [
"lowercase",
"autocomplete_filter"
]
}
}
}
},
"mappings": {
"properties": {
"title": {
"type": "text",
"analyzer": "autocomplete",
"search_analyzer": "standard"
}
}
}
}
Индекс несколько дел c
{
"title" : "formless"
}
{
"title" : "form"
}
{
"title" : "formulation"
}
Поисковый запрос в поле title
, как указано в вопросе
{
"query": {
"match": {
"title": "form"
}
}
}
Результат поиска с точным соответствием с наибольшим количеством баллов
"hits": [
{
"_index": "so-60523240-score",
"_type": "_doc",
"_id": "1",
"_score": 0.16410133,
"_source": {
"title": "form"
}
},
{
"_index": "so-60523240-score",
"_type": "_doc",
"_id": "2",
"_score": 0.16410133,
"_source": {
"title": "formulation"
}
},
{
"_index": "so-60523240-score",
"_type": "_doc",
"_id": "3",
"_score": 0.16410133,
"_source": {
"title": "formaldehyde"
}
},
{
"_index": "so-60523240-score",
"_type": "_doc",
"_id": "4",
"_score": 0.16410133,
"_source": {
"title": "formless"
}
}
]