Как сделать запрос на точное совпадение в ElasticSearch? - PullRequest
0 голосов
/ 19 марта 2020

Я хочу сделать запрос на точное совпадение с индексом ElasticSearch,
У меня есть следующие данные -

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 2,
      "relation" : "eq"
    },
    "max_score" : 0.21110919,
    "hits" : [
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 0.21110919,
        "_source" : {
          "id" : 1,
          "name" : "test"
        }
      },
      {
        "_index" : "test",
        "_type" : "_doc",
        "_id" : "2",
        "_score" : 0.160443,
        "_source" : {
          "id" : 2,
          "name" : "test two"
        }
      }
    ]
  }
}

Я хочу запросить поле name,
Я пытаюсь найти имя test,
Но мне возвращаются оба документа.

Ожидаемый результат - единственный документ 1.
Отображение выглядит следующим образом -

{
  "test" : {
    "mappings" : {
      "properties" : {
        "id" : {
          "type" : "long"
        },
        "name" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }
      }
    }
  }
}

Я пробовал следующее -

GET /test/_search
{
  "query": {
    "bool": {
      "must": {
        "term" : { 
          "name": "test"
        }
      }
    }
  }
}


GET /test/_search
{
  "query": {
    "match": {
      "name": "test"
    }
  }
}

Ответы [ 2 ]

1 голос
/ 19 марта 2020

В дополнение к ссылке на ответ, которую я предоставил в комментарии, я бы предложил вам определить поле имени как:

{
   "name":{
      "type": "text",
      "fields":{
         "keyword":{
            "type": "keyword"
         }
      }
   }
}

, а затем запрашивать поле name.keyword всякий раз, когда вам требуется точное соответствие (случай чувствительный) и name, если вы хотите частичное совпадение, например поиск только по имени.

1 голос
/ 19 марта 2020

Похоже, вы используете text тип данных в своем поле name, которое плюет test two в 2 токена как test и two, следовательно, оно соответствует вашему поисковому запросу test как match запрос анализируется и применяет тот же анализатор к полученным токенам, сопоставленным с токенами документов, присутствующими в инвертированном индексе.

Решение вашего примера использования

Индекс def

{
  "mappings": {
    "properties": {
      "name": {
        "type": "keyword" --> note use of `keyword` type
      }
    }
  }
}

Индексировать образцы документов

{
   "name" : "test two"
}

{
   "name" : "test"
}

Поисковый запрос такой же, как ваш

{
    "query": {
        "match": {
            "name": "test"
        }
    }
}

Результаты поиска, как вы хотите

"hits": [
         {
            "_index": "so_key",
            "_type": "_doc",
            "_id": "1",
            "_score": 0.6931471,
            "_source": {
               "name": "test"
            }
         }
      ]

Важное примечание: Вы можете использовать API анализа , чтобы увидеть, как ваши данные индексируются, например,

Использование стандартного (анализатор по умолчанию) в текстовом поле

POST _analyze

{
    "text": "test two",
    "analyzer" : "standard" --> Change analyzer to keyword and see diff
}

Жетоны

{
    "tokens": [
        {
            "token": "test",
            "start_offset": 0,
            "end_offset": 4,
            "type": "<ALPHANUM>",
            "position": 0
        },
        {
            "token": "two",
            "start_offset": 5,
            "end_offset": 8,
            "type": "<ALPHANUM>",
            "position": 1
        }
    ]
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...