Влияет ли параметр «из» в ElasticSearch на кластер ElasticSearch? - PullRequest
0 голосов
/ 14 ноября 2018

У меня есть большое количество документов (около 34719074 документов) в виде индекса (ES 2.4.4).Во время поиска мой ES Cluster, по-видимому, оказывает сильное влияние (задержка поиска, загрузка ЦП, память JVM и средняя нагрузка), когда параметр «from» высокий (больше 100000, параметр «size» постоянен).Есть какая-то конкретная причина для этого?Мой запрос выглядит так:

 {
         "explain": false,
         "size": 100,
          "from": <>,
            "_source": {
                "excludes": [],
                "includes": [
                    <around 850 fields> 
                ]
            },
            "sort": [
            <sorting from an string field>
            ]
}

1 Ответ

0 голосов
/ 14 ноября 2018

Это классическая проблема глубокой нумерации страниц. Вы можете прочитать ссылку на нумерацию страниц в Elasticsearch . По сути, для получения следующего набора документов после пропуска 100000 документов потребуется много памяти, поскольку для получения результирующего набора из 100 000 документов и более 100 000 документов необходимо получить из каждого сегмента и затем обработать (ранжирование, сортировка и т. Д.). Ранжирование / сортировка по меньшему набору результатов занимает меньше времени по сравнению с большим набором результатов.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...