azure поиск реплики / разделов влияет на скорость обновления индекса? - PullRequest
0 голосов
/ 07 января 2020

У нас есть экземпляр поиска azure (s1, 2 реплики, 2 раздела), созданный в 2016 году, и когда я попытался загрузить 50 миллионов строк в этот экземпляр, мы обнаружили, что старый экземпляр все еще имеет ограничение в 30 миллионов records.

Нет проблем, я создал новый azure экземпляр поиска (s1, 1 реплика, 1 раздел) и начал загружать те же данные. К моему удивлению, скорость загрузки на новом экземпляре намного лучше, чем на старом (почти в два раза быстрее обновления).

Мне интересно, в чем может быть причина? Индекс, который я загружал, является новым индексом, поэтому никто не будет запрашивать его. Вот различия, которые я вижу между новым и старым поисковым индексом:

  1. Нет трафика traffi c в новом экземпляре поиска, старый экземпляр поиска действительно получает traffi c из производственной среды. Но это по другим поисковым индексам.
  2. Новый экземпляр поиска имеет 1 реплику, 1 раздел, старый имеет 2 реплики, 2 раздела.

Просто очень любопытно, почему я вижу такие разница в скорости. Если я выполню поисковый запрос, на самом деле производительность будет очень похожа между старым и новым. Просто скорость обновления индекса намного лучше.

1 Ответ

1 голос
/ 09 января 2020

Запрос трафика c является фактором, но это также может быть количество реплик. Каждая реплика добавляет работу к процессу индексирования, в то время как каждый раздел добавляет параллелизм, доступный для индексации. Если вы добавили раздел к новой службе и индексирование ускорилось, это не было бы удивительным результатом.

Все это говорит о том, что наиболее вероятное объяснение в вашем случае состоит в том, что ваша новая служба работает аппаратное обеспечение быстрее , чем старое. Вот как мы смогли снять ограничение на количество документов для новых услуг.

...