Данные:
"hits" : [
{
"_index" : "index22",
"_type" : "_doc",
"_id" : "r_QurHEBvLUX24hJph0B",
"_score" : 1.0,
"_source" : {
"empId" : 1,
"feedbackId" : 1,
"feedback" : 2
}
},
{
"_index" : "index22",
"_type" : "_doc",
"_id" : "sPQurHEBvLUX24hJ0R3x",
"_score" : 1.0,
"_source" : {
"empId" : 1,
"feedbackId" : 1,
"feedback" : 2
}
},
{
"_index" : "index22",
"_type" : "_doc",
"_id" : "sfQurHEBvLUX24hJ5h16",
"_score" : 1.0,
"_source" : {
"empId" : 1,
"feedbackId" : 2,
"feedback" : 6
}
}
]
Я взял одного сотрудника с идентификатором 1 и тремя отзывами (два дубликата для identifierId 1 и один для identifierId2). Общая сумма равна 10, а использование отдельной суммы равно 8
Запрос:
Я использую сценарий metri c агрегация для создания словаря уникальный feedbackIdentifierI и значение обратной связи.
- "init_script":
Выполняется перед любой коллекцией документов. Позволяет агрегации устанавливать любое начальное состояние.
Объявлены транзакции хеш-таблицы "
"map_script"
Выполняется один раз для каждого документа, собранного L oop по всему документу, и добавляет уникальный идентификатор и соответствующее значение обратной связи в словарь
объединить_скрипт
Выполняется один раз для каждого шарда после завершения сбора документов
Возвращать словарь для всех шардов
redu_script
Выполняется один раз на координирующем узле после того, как все осколки вернули свои результаты
Еще раз go через все словари, возвращаемые каждым осколок и создать единый уникальный словарь. L oop через словарь для получения суммы или количества отзывов
{
"size": 0,
"aggs": {
"employee": {
"terms": {
"field": "empId",
"size": 10000
},
"aggs": {
"distinct_sum_feedback": {
"scripted_metric": {
"init_script": "state.transactions =new Hashtable();",
"map_script": "if(state.transactions.get(doc.feedbackId)==null){state.transactions.put(doc.feedbackId, doc.feedback.value)}",
"combine_script": "return state.transactions",
"reduce_script": "def sum=0;def feedbacks=new Hashtable();for(a in states){for(entry in a.entrySet()){if(feedbacks.get(entry.getKey())==null){feedbacks.put(entry.getKey(),entry.getValue());}}}for(entry in feedbacks.entrySet()){sum+=entry.getValue();} return sum;"
}
},
"distinct_count_feedback": {
"cardinality": {
"field": "feedbackId"
}
},
"distinct_avg_feedback": {
"bucket_script": {
"buckets_path": {
"sum": "distinct_sum_feedback.value",
"count": "distinct_count_feedback.value"
},
"script": "params.sum/params.count"
}
}
}
},
"sum_feedback": {
"sum_bucket": {
"buckets_path": "employee>distinct_sum_feedback.value"
}
},
"count_feedback": {
"sum_bucket": {
"buckets_path": "employee>distinct_count_feedback.value"
}
}
}
}
Результат: Различное количество для пользователя 1: 2
Различное количество для пользователя 1: 8 (10 для дубликата)
"aggregations" : {
"employee" : {
"doc_count_error_upper_bound" : 0,
"sum_other_doc_count" : 0,
"buckets" : [
{
"key" : 1,
"doc_count" : 3,
"distinct_count_feedback" : {
"value" : 2
},
"distinct_sum_feedback" : {
"value" : 8
},
"distinct_avg_feedback" : {
"value" : 4.0
}
},
{
"key" : 2,
"doc_count" : 1,
"distinct_count_feedback" : {
"value" : 1
},
"distinct_sum_feedback" : {
"value" : 6
},
"distinct_avg_feedback" : {
"value" : 6.0
}
}
]
},
"sum_feedback" : {
"value" : 14.0
},
"count_feedback" : {
"value" : 3.0
}
}