Как отладить документ, недоступный для поиска в Elasticsearch - PullRequest
1 голос
/ 08 июня 2019

Я пытаюсь найти и получить документы из Elasticsearch, но в некоторых случаях я не получаю обновленные документы.Под обновлением я имею в виду, что мы периодически обновляем документы в Elasticsearch.Документы в ElasticSearch обновляются с интервалом в 30 секунд, а количество документов может варьироваться от 10 до 100 тысяч.Мне известно, что обновление в Elasticsearch обычно медленное.

Я подозреваю, что это происходит, потому что Elasticsearch хотя и принял документы, но документы не были доступны для поиска.Поэтому у меня есть следующие вопросы:

  1. Можно ли измерить время между индексацией и документами, доступными для поиска?В Elasticsearch есть настройка, которая может регистрировать больше информации в журналах Elasticsearch?
  2. Есть ли в Elasticsearch параметр, позволяющий вести журнал всякий раз, когда происходит операция слияния?
  3. Любые другие предложения, которые помогут оптимизировать производительность?

Заранее спасибо заваша помощь.

1 Ответ

0 голосов
/ 08 июня 2019

По умолчанию для параметра refresh_interval установлено значение 1 секунда, поэтому, если вы не измените этот параметр, каждое обновление будет доступно для поиска максимум через 1 секунду.

Если вы хотите сделать результаты поиска доступными, как только вывыполнив операцию обновления, вы можете использовать параметр refresh .

Используя refresh=wait_for, конечная точка ответит, как только произойдет обновление.Если вы используете refresh=true, операция обновления будет запущена.Будьте осторожны, используя refresh=true, если у вас много обновлений, поскольку они могут повлиять на производительность.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...