Подозрительно низкий результат на Elasticsearch - PullRequest
0 голосов
/ 04 февраля 2020

Следующий запрос возвращает 24 сегмента:

{
    "query": {
        "bool": {
            "filter": [
                {
                    "match": {
                        "partnerCategory": 6
                    }
                }
            ]
        }
    },
    "size": 0,
    "aggs": {
        "uniqcnpjs": {
            "terms": {
                "field": "partnerId"
            }
        }
    }
}

Ожидаемый результат составляет около 750 сегментов. 24 очень низко.

Если принять во внимание, что если вы добавляете "doc_count" каждого сегмента, он не будет соответствовать количеству попаданий, если вы не агрегируете.
Сумма сегментов doc_count должна быть не менее 20к. Теперь это 2,5 тыс.

Итак, кто-нибудь может сказать мне, что происходит? Я что-то не так делаю?

1 Ответ

2 голосов
/ 04 февраля 2020

Вы пытались установить для параметра size агрегации terms очень высокое значение? например,

"aggs": {
  "uniqcnpjs": {
    "terms": {
      "field": "partnerId",
      "size": 1000
    }
  }
}

Кроме того, проверяется, является ли результат агрегации cardinality ниже ожидаемого. например,

"aggs": {
  "cardinality_partnerid": {
    "cardinality": {
      "field": "partnerId"
    }
  }
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...