Вопрос по диапазону запросов Elasticsearch через Shards - PullRequest
0 голосов
/ 11 апреля 2019

Я хочу использовать Elasticsearch для извлечения документов из индекса, который находится во временном диапазоне.

Итак, чтобы дать некоторое представление, у меня есть приложение, которое обрабатывает данные. В случае сбоев у меня нет возможности повторить попытку, но вместо этого я намереваюсь отправить его в Elasticsearch к индексу сбоев для повторных попыток. С этого момента я планирую иметь еще одно приложение, которое будет запускаться каждые 1 минуту, 5 минут или 30 секунд (в основном предварительно настроенный интервал времени) и извлекать документы в этот период времени и повторять попытки. Для этого я намерен выполнить запросы в диапазоне дат. У меня есть вопрос по этому поводу, хотя.

Из того, что я понял о пути чтения Elastic search, он распространит запрос на чтение для всех применимых сегментов. Поскольку это запрос на основе отметки времени, это может означать также охват всех сегментов. Итак, я хотел понять последствия этого для производительности. Один из вариантов - определить предварительно определенный индекс с типом данных ключевого слова и создать их для выбранного интервала опроса. Будет ли это жизнеспособным вариантом?

Кроме того, если документ все еще не работает, я планирую удалить старый документ и отправить его снова с последней отметкой времени.

Кто-нибудь пробовал этот шаблон раньше? Или есть другой лучший способ сделать то же самое?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...