ElasticSearch [6.5] извлекает проблему времени выполнения нескольких записей - PullRequest
0 голосов
/ 25 декабря 2018

Я пытаюсь получить около 2,5 миллионов записей из упругого поиска с помощью Java High-Client эластичного поиска.Что занимает слишком много времени (от 15 до 22 минут в зависимости от количества записей) для извлечения всей записи с использованием API прокрутки, поскольку имеет ограничение на выборку 10 000 записей в одном запросе.Я также попробовал нарезанную прокрутку, но это занимает больше времени, чем обычная прокрутка.Ниже приведено мое предположение об API нарезки по частям:

  1. Я разделил свой запрос на прокрутку на пять частей.Который создает 5 запросов.
  2. Я отправляю 5 запросов в разных потоках.
  3. Поскольку каждый запрос прокрутки по частям является индивидуальным запросом.Я предполагаю, что для каждого запроса прокрутки среза сначала он выбирает все записи (2,5 миллиона), а затем отфильтровывает записи, которые принадлежат этому конкретному фрагменту.Что приводит к увеличению времени.

Может кто-нибудь сказать мне более эффективный способ получить все записи.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...