Дата агрегации с использованием Elasticsearch RestHighLevelClient - PullRequest
0 голосов
/ 17 марта 2020

Я использую Elasticsearch RestHighLevelClient и пытаюсь реализовать sql ниже:

выберите формат (дата, 'гггг-ММ-дд'), количество (*) из группы заказов по формату (дата, 'гггг-мм-дд')

    SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
    sourceBuilder.query(QueryBuilders.matchAllQuery());
    sourceBuilder.aggregation(AggregationBuilders.terms("date_count").field("time").format("yyyy-MM-dd"));
    SearchRequest searchRequest = new SearchRequest("order_*");
    searchRequest.source(sourceBuilder);
    SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
    Aggregations aggregations = searchResponse.getAggregations();

Я получил результат, но со многими результатами повторения даты, такими как:

buckets:
  bucket1:
    key: 1583390009000
    keyAsString: 2020-03-05
    docCount: 4
  bucket2:  
    key: 1583391748000
    keyAsString: 2020-03-05
    docCount: 5

Как следует избегать повторения даты ? Я имею в виду ту же дату (например, 2020-03-05), которая считается одним ведром.

Вот несколько примеров документов

  {
    "_index": "order_202003",
    "_type": "_doc",
    "_id": "1568274527051",
    "_score": 1,
    "_source": {
      "auto": 0,
      "collection_currency": "RMB",
      "collection_value": 0,
      "customerid": "",
      "freight": 0,
      "gs": 201101,
      "status": "accept",
      "time": "2020-03-05T10:01:23.000+0800"
    }
  },
  {
    "_index": "order_202003",
    "_type": "_doc",
    "_id": "1568274527078",
    "_score": 1,
    "_source": {
      "auto": 0,
      "collection_currency": "RMB",
      "collection_value": 0,
      "customerid": "",
      "freight": 0,
      "gs": 413572,
      "status": "accept",
      "time": "2020-03-05T17:29:53.000+0800"
    }
  }

1 Ответ

1 голос
/ 17 марта 2020

Вы должны использовать агрегирование гистограммы даты вместо:

SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
sourceBuilder.query(QueryBuilders.matchAllQuery());
//sourceBuilder.aggregation(AggregationBuilders.terms("date_count").field("time").format("yyyy-MM-dd"));
sourceBuilder.aggregation(AggregationBuilders.dateHistogram("date_count").calendarInterval(DateHistogramInterval.DAY).field("time"));
SearchRequest searchRequest = new SearchRequest("order_*");
searchRequest.source(sourceBuilder);
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
Aggregations aggregations = searchResponse.getAggregations();
...