Агрегация на .keyword для возврата только ключей, которые содержат определенную строку - PullRequest
1 голос
/ 24 октября 2019

Новое в скоплениях в эластичном поиске. Использование 7.2. Я пытаюсь написать агрегацию на Tree.keyword, чтобы вернуть только количество документов, имеющих ключ, содержащий слово «Ветвь». Я попробовал субагрегации, bucket_selector (который не работает для ключевых строк) и сценарии. У кого-нибудь есть какие-либо идеи или предложения о том, как к этому подойти?

Отображение:

{
  "testindex" : {
    "mappings" : {
      "properties" : {
        "Tree" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword"
            }
          }
        }
      }
    }
  }
}

Пример запроса, который возвращает все ключи, но мне нужно лишь ограничить возврат ключей с помощью "Ветвь "или, точнее, просто подсчет количества ключей" Ветвь ":

GET testindex/_search
{
  "aggs": {
    "bucket": {
      "terms": {
        "field": "Tree.keyword"
      }
    }
  }
}

Возвращает:

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 1,
    "successful" : 1,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : {
      "value" : 1,
      "relation" : "eq"
    },
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "testindex",
        "_type" : "_doc",
        "_id" : "1",
        "_score" : 1.0,
        "_source" : {
          "Tree" : [
            "Car:76",
            "Branch:yellow",
            "Car:one",
            "Branch:blue"
          ]
        }
      }
    ]
  },
  "aggregations" : {
    "bucket" : {
      "doc_count_error_upper_bound" : 0,
      "sum_other_doc_count" : 0,
      "buckets" : [
        {
          "key" : "Car:76",
          "doc_count" : 1
        },
        {
          "key" : "Branch:yellow",
          "doc_count" : 1
        },
        {
          "key" : "Car:one",
          "doc_count" : 1
        },
        {
          "key" : "Branch:blue",
          "doc_count" : 1
        }
      ]
    }
  }
}

Ответы [ 3 ]

1 голос
/ 24 октября 2019

Вы должны добавить включения для предельного результата. Вот пример кода, и, надеюсь, это поможет вам.

 GET testindex/_search
    {
    "_source": {
    "includes": [
      "Branch"
    ]
    },
      "aggs": {
        "bucket": {
          "terms": {
            "field": "Tree.keyword"
          }
        }
      }
    }
0 голосов
/ 25 октября 2019

Спасибо за помощь! К сожалению, ни одно из этих решений не помогло мне. Я закончил тем, что использовал скрипт для возврата всех веток и затем установил все остальное в новый ключ. Затем использовал скрипт-контейнер, чтобы вычесть 1 в Total_Buckets. Возможно, это лучшее решение, но, надеюсь, оно кому-нибудь поможет


GET testindex/_search
{
  "aggs": {
    "bucket": {
      "cardinality": {
        "field": "Tree.keyword",
        "script": {
          "lang": "painless",
          "source": "if(_value.contains('Branches:')) { return _value} return 1;"
        }
      }
    },
    "Total_Branches": {
      "bucket_script": {
        "buckets_path": {
          "my_var1": "bucket.value"
        },
        "script": "return params.my_var1-1"
      }
    }
  }
}
0 голосов
/ 24 октября 2019

Можно отфильтровать значения, для которых будут создаваться сегменты. Это можно сделать с помощью параметров include и exclude , которые основаны на строках регулярных выражений или массивах точных значений. Кроме того, включает в себя предложения, которые могут фильтроваться с использованием выражений разделов.

В вашем случае это должно быть так,

GET testindex/_search
{
  "aggs": {
    "bucket": {
      "terms": {
        "field": "Tree.keyword",
        "include": "Branch:*"
      }
    }
  }
}
...