Я создал новый индекс и добавил отображение и настройки, как показано ниже:
{
"new_index5" : {
"aliases" : { },
"mappings" : {
"current" : {
"properties" : {
"did" : {
"type" : "integer"
},
"fil_date" : {
"type" : "double"
},
"file_nr" : {
"type" : "double"
},
"filing_date" : {
"type" : "double"
},
"id" : {
"type" : "integer"
},
"mark_identification" : {
"type" : "keyword",
"normalizer" : "lowercase_normalizer"
},
"mark_text" : {
"type" : "keyword",
"normalizer" : "lowercase_normalizer"
},
"mark_type_id" : {
"type" : "text"
},
"markdescr" : {
"type" : "text"
},
"markdescrtext" : {
"type" : "text"
},
"niceclmain" : {
"type" : "double"
},
"owname" : {
"type" : "keyword",
"normalizer" : "lowercase_normalizer"
},
"party_name" : {
"type" : "keyword",
"normalizer" : "lowercase_normalizer"
},
"primary_code" : {
"type" : "text"
},
"registration_date" : {
"type" : "double"
},
"registration_number" : {
"type" : "double"
},
"serial_number" : {
"type" : "double"
},
"status_code" : {
"type" : "text"
},
"statusapplication" : {
"type" : "text"
}
}
}
},
"settings" : {
"index" : {
"number_of_shards" : "5",
"provided_name" : "new_index5",
"creation_date" : "1527686957833",
"analysis" : {
"normalizer" : {
"lowercase_normalizer" : {
"filter" : [
"lowercase"
],
"type" : "custom",
"char_filter" : [ ]
}
}
},
"number_of_replicas" : "1",
"uuid" : "9YdUrs1cSBuqDJmvSPOm6g",
"version" : {
"created" : "6020499"
}
}
}
}
}
И добавил агрегацию в моем запросе для первого поискового случая, например:
GET _search
{
"query": {
"bool": {
"must" : [
{
"match": {
"mark_text": "smart"
}
}
]
}
},
"aggs": {
"mark_texts": {
"terms": {
"field": "mark_text"
}
}
}
}
Это даетme результаты, включая «умный» и «умный» оба.
Для второго случая поиска я использую нечеткий.
Я до сих пор не знаю, как агрегация и нормализаторы решили мою проблему.Но я пытаюсь это понять.