Агрегация ElasticSearch по полному массиву - PullRequest
0 голосов
/ 13 декабря 2018

Как я могу получить агрегацию по всем элементам массива внутри документа, а не по каждому значению массива.Например, у меня есть несколько документов, например,

{'some_field': [1,2]}
{'some_field': [1]}
{'some_field': [1]}
{'some_field': [7,2]}

Теперь с простым запросом агрегации, как этот

{
"aggs" : {
    "agg_name" : {
        "terms" : {
            "field" : "some_field"
        }
    }
},
"size": 0
}

я получил такой результат

"buckets": [
        {
          "key": "1",
          "doc_count": 3
        },
        {
          "key": "2",
          "doc_count": 2
        },
        ...
]

нохочу получить полный вид массива, например

"buckets": [
        {
          "key": [1],
          "doc_count": 2
        },
        {
          "key": [1,2],
          "doc_count": 1
        },
        {
          "key": [7,2],
          "doc_count": 1
        },
]

1 Ответ

0 голосов
/ 13 декабря 2018

Я думаю это ваш ответ:

Добавьте подполе "states.raw" в отображении:

PUT /test_index
{
   "mappings": {
      "doc": {
         "properties": {
            "states": {
               "type": "string",
               "fields": {
                  "raw": {
                     "type": "string",
                     "index": "not_analyzed"
                  }
               }
            }
         }
      }
   }
}

Затем добавьте пару документов:

POST /test_index/doc/_bulk
{"index":{"_id":1}}
{"states":["New York","New Jersey","California"]}
{"index":{"_id":2}}
{"states":["New York","North Carolina","North Dakota"]}

Запустить агрегацию для подполя:

POST /test_index/_search
{
    "size": 0, 
    "aggs" : {
        "states" : {
            "terms" : { 
                "field" : "states.raw",
                "size": 10
            }
        }
    }
}

возвращение:

{
   "took": 1,
   "timed_out": false,
   "_shards": {
      "total": 1,
      "successful": 1,
      "failed": 0
   },
   "hits": {
      "total": 2,
      "max_score": 0,
      "hits": []
   },
   "aggregations": {
      "states": {
         "doc_count_error_upper_bound": 0,
         "sum_other_doc_count": 0,
         "buckets": [
            {
               "key": "New York",
               "doc_count": 2
            },
            {
               "key": "California",
               "doc_count": 1
            },
            {
               "key": "New Jersey",
               "doc_count": 1
            },
            {
               "key": "North Carolina",
               "doc_count": 1
            },
            {
               "key": "North Dakota",
               "doc_count": 1
            }
         ]
      }
   }
}

Вот код, который я использовал для его проверки:

...