Скрипт Bucket Elastic Search для агрегированных значений процентилей - PullRequest
0 голосов
/ 26 января 2019

Ниже приведено мое постановление задачи. У меня есть один поисковый вызов упругого поиска, в котором есть запрос для расчета 99% -ых процентилей агрегации на одном из полей.В ответ я получаю агрегированный ответ, значения которого рассчитываются в процентах.Но опять же мне нужно применить фильтр к агрегированному значению процентиля, используя «bucket_selector» для фильтрации значений.Например, если агрегированное значение процентиля> 60, то мне нужно включить в мой ответ.Ниже приведен пример запроса агрегации json:

        {
      "aggs": {
        "2": {
           "terms": {
           "field": "component",
           "size": 500,
           "order": {
           "1": "desc"
          }
         },
         "aggs": {
              "1": {
                   "percentiles": {
                       "field": "field1",
                        "percents": [
                            99
                         ],
                  "keyed": false
                   }
              },
        "filter_gt_than_60sec": {
          "bucket_selector": {
            "buckets_path": {
              "value": "1"
            },
            "script": "params.value > 60L"
          }
        }
      }
      }
     },
      "size": 0,
      "_source": {
        "excludes": []
      },
      "stored_fields": [
        "*"
      ],
      "script_fields": {},
      "query": {
        "bool": {
          "must": [
            {
              "match_all": {}
            },
            {
              "range": {
                "@timestamp": {
                  "gte": 1547889125683,
                  "lte": 1547975525684,
                  "format": "epoch_millis"
                }
              }
            }
          ],
          "filter": [],
          "should": [],
          "must_not": []
        }
      },
      "timeout": "30000ms"
     }

Ошибка, которую я получаю:

        {
            "error": {
                "root_cause": [],
                "type": "search_phase_execution_exception",
                "reason": "",
                "phase": "fetch",
                "grouped": true,
                "failed_shards": [],
                "caused_by": {
                    "type": "aggregation_execution_exception",
                    "reason": "buckets_path must reference either a number value or a single value numeric metric aggregation, got: org.elasticsearch.search.aggregations.metrics.percentiles.tdigest.InternalTDigestPercentiles"
                }
            },
            "status": 503
        }

Образец документа с отображением ответов, если не используются селекторы сегментов:

    {
      "aggregations": {
        "2": {
          "doc_count_error_upper_bound": 0,
          "sum_other_doc_count": 0,
          "buckets": [
            {
              "1": {
                "values": [
                  {
                    "key": 99,
                    "value": 70
                  }
                ]
              },
              "key": "abc"
            },
            {
              "1": {
                "values": [
                  {
                    "key": 99,
                    "value": 10
                  }
                ]
              },
            "key": "abc1"
        }
        ]
    }}}

Я понял из вышеприведенной ошибки, что я не могу применить "bucket_selector" к полям процентиля. Тогда как я могу отфильтровать агрегированные поля процентиля, значения которых больше 60. Я читал о "процентиле_бакете", но он рассчитанпроцентили по значениям поля;но он не отфильтровывается по агрегированным полям процентиля.Заранее спасибо.

1 Ответ

0 голосов
/ 29 января 2019

Спасибо, проблема решена, и она может получить доступ к полю значения процентиля, заменив текущий запрос на публикацию кодом ниже buckets_path:

       "bucket_selector": {
        "buckets_path": {
          "value": "1[99.0]"
        },
        "script": "params.value > 60L"
      }
...