Повысить счет результата запроса термина с несколькими совпадениями - PullRequest
0 голосов
/ 23 октября 2018

В моем индексе эластичного поиска хранятся несколько документов, которые выглядят следующим образом:

PUT tests
{
  "mappings": {
    "_doc": {
      "dynamic": false,
      "properties": {
        "objects": {
          "type": "text",
          "fields": {
            "keyword": {
              "type": "keyword"
            }
          }
        },
        "text": {
          "type": "text"
        }
      }
    }
  }
}

PUT tests/_doc/1
{
  "text": "lel",
  "objects": ["A"]
}

PUT tests/_doc/2
{
  "text": "lol",
  "objects": ["B"]
}

PUT tests/_doc/3
{
  "text": "lil",
  "objects": ["C"]
}

PUT tests/_doc/4
{
  "text": "lul",
  "objects": ["A", "B", "C"]
}

Я хочу запросить объекты с помощью следующего запроса:

GET _search
{

  "query": {
    "terms": {
      "objects.keyword": ["A", "B", "C"]
    }
  }
}

Результатвключает все три примера объектов, которые я предоставил.

Мой вопрос заключается в том, могу ли я сделать объект более важным (boost), который имеет полное соответствие (все ключевые слова в массиве объектов), а не толькотолько частичное совпадение, и если да, то как, так как я не смог найти никакой информации в документации по упругому поиску.

Вот результат, который я сейчас получаю:

{
  "took": 4,
  "timed_out": false,
  "_shards": {
    "total": 11,
    "successful": 11,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 4,
    "max_score": 1,
    "hits": [
      {
        "_index": "tests",
        "_type": "_doc",
        "_id": "2",
        "_score": 1,
        "_source": {
          "text": "lol",
          "objects": [
            "B"
          ]
        }
      },
      {
        "_index": "tests",
        "_type": "_doc",
        "_id": "4",
        "_score": 1,
        "_source": {
          "text": "lul",
          "objects": [
            "A",
            "B",
            "C"
          ]
        }
      },
      {
        "_index": "tests",
        "_type": "_doc",
        "_id": "1",
        "_score": 1,
        "_source": {
          "text": "lel",
          "objects": [
            "A"
         ]
        }
      },
      {
        "_index": "tests",
        "_type": "_doc",
        "_id": "3",
        "_score": 1,
        "_source": {
          "text": "lil",
          "objects": [
            "C"
          ]
        }
      }
    ]
  }
}

1 Ответ

0 голосов
/ 23 октября 2018

Я думаю, что вашей лучшей ставкой является использование запроса bool с should и minimum_should_match: 1.

GET _search
{

  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "objects.keyword": "A" 
          }
        },
        {
          "term": {
            "objects.keyword": "B" 
          }
        },
        {
          "term": {
            "objects.keyword": "C" 
          }
        }
      ],
      "minimum_should_match": 1
    }
  }
}

Результаты:

{
  "took": 3,
  "timed_out": false,
  "_shards": {
    "total": 6,
    "successful": 6,
    "skipped": 0,
    "failed": 0
  },
  "hits": {
    "total": 4,
    "max_score": 1.5686159,
    "hits": [
      {
        "_index": "tests",
        "_type": "_doc",
        "_id": "4",
        "_score": 1.5686159,
        "_source": {
          "text": "lul",
          "objects": [
            "A",
            "B",
            "C"
          ]
        }
      },
      {
        "_index": "tests",
        "_type": "_doc",
        "_id": "1",
        "_score": 0.2876821,
        "_source": {
          "text": "lel",
          "objects": [
            "A"
          ]
        }
      },
      {
        "_index": "tests",
        "_type": "_doc",
        "_id": "3",
        "_score": 0.2876821,
        "_source": {
          "text": "lil",
          "objects": [
            "C"
          ]
        }
      },
      {
        "_index": "tests",
        "_type": "_doc",
        "_id": "2",
        "_score": 0.18232156,
        "_source": {
          "text": "lol",
          "objects": [
            "B"
          ]
        }
      }
    ]
  }
}

РЕДАКТИРОВАТЬ: Вот почему, какобъяснено документами (https://www.elastic.co/guide/en/elasticsearch/reference/current/query-dsl-bool-query.html):

В запросе bool используется подход «больше совпадений - лучше», поэтому оценка каждого соответствия должна или должна быть добавлена ​​вместе, чтобы получить окончательный результат _scoreза каждый документ.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...