Solr CDCR (перекрестная репликация данных) и PULL-реплики для поиска не NRT (почти в реальном времени) - PullRequest
0 голосов
/ 15 февраля 2019

На начальной странице Solr CDCR написано

CDCR увеличивает [обычную репликацию], где задержки в сети больше, чем рассчитана модель SolrCloud.

Рассмотрим этот сценарий: настройка поиска вторичного центра обработки данных должна

  • просто выполнять простой поиск, ничего не требуется, требуется задержка в несколько минут,
  • продолжайте доставлять простоПоиск, если центры обработки данных отключены, даже в течение нескольких часов или дней, независимо от того, является ли индекс устаревшим, старые результаты лучше, чем никакие
  • синхронизируются с основным центром обработки данных после восстановления соединения.

Я хотел бы знать следующее: что именно не подходит для модели SolrCloud и как это проявится, если мы не используем CDCR, а наивно используем «вытягивающие» реплики во вторичном центре обработки данных:

  • потеря данных
  • снижение производительности при индексации (насколько это может быть плохо)
  • ухудшение качестваry производительность (где, основной, дополнительный, оба)
  • система зависла на много секунд (на стороне запроса, на стороне индекса?), в то время как операции ожидают

И наконец: что такое задержка в сетипределы (примерно, порядка), где все это начинает создавать проблемы?

...