Я использую Elasticsearch RestHighLevelClient и пытаюсь реализовать sql ниже:
выберите формат (дата, 'гггг-ММ-дд'), количество (*) из группы заказов по формату (дата, 'гггг-мм-дд')
SearchSourceBuilder sourceBuilder = new SearchSourceBuilder();
sourceBuilder.query(QueryBuilders.matchAllQuery());
sourceBuilder.aggregation(AggregationBuilders.terms("date_count").field("time").format("yyyy-MM-dd"));
SearchRequest searchRequest = new SearchRequest("order_*");
searchRequest.source(sourceBuilder);
SearchResponse searchResponse = client.search(searchRequest, RequestOptions.DEFAULT);
Aggregations aggregations = searchResponse.getAggregations();
Я получил результат, но со многими результатами повторения даты, такими как:
buckets:
bucket1:
key: 1583390009000
keyAsString: 2020-03-05
docCount: 4
bucket2:
key: 1583391748000
keyAsString: 2020-03-05
docCount: 5
Как следует избегать повторения даты ? Я имею в виду ту же дату (например, 2020-03-05), которая считается одним ведром.
Вот несколько примеров документов
{
"_index": "order_202003",
"_type": "_doc",
"_id": "1568274527051",
"_score": 1,
"_source": {
"auto": 0,
"collection_currency": "RMB",
"collection_value": 0,
"customerid": "",
"freight": 0,
"gs": 201101,
"status": "accept",
"time": "2020-03-05T10:01:23.000+0800"
}
},
{
"_index": "order_202003",
"_type": "_doc",
"_id": "1568274527078",
"_score": 1,
"_source": {
"auto": 0,
"collection_currency": "RMB",
"collection_value": 0,
"customerid": "",
"freight": 0,
"gs": 413572,
"status": "accept",
"time": "2020-03-05T17:29:53.000+0800"
}
}