Ниже была последовательность событий:
кластер узлов (узел = N-1) (сам узел был главным)
5 индексов: 12 осколков каждый (всего 60 осколков)
Масштабирование кластера и добавление 2 реплик (N-2 и N-3)
Реплики инициализированы, но #ActiveShards до 60 (почему не 180?)
Главный узел (N-1) покидает кластер (причина: shut_down)
ActiveShards до 60, кластер зеленый
Выбран новый мастер (N-3), а кластер все еще зеленый
Исходный узел (N-1) присоединяется к кластеру (через ~ 50 минут) и принимает нового мастера (N-3).
Вскоре после этого кластер становится красным и множественные первичные и их вторичные осколки становятся неназначенными.
У меня есть следующие вопросы:
1. When the 2 nodes(N-2 and N-3) joined the cluster(see step 2 above), cluster was green
but the number of ActiveShards was still 60(why not 180?)
2. Why did cluster turn red soon after the node(N-1) rejoined the cluster?
3. Node restart did not help or trigger re-allocation.
4. Cluster reroute not do anything. Why?
Я мог видеть, что на узле (N-1) имеются сегменты, доступные на его диске, но ES не было
признавая их действительными осколками.
В итоге мне пришлось установить 'index.recovery.initial_shards' на 1. Вскоре после того, как все осколки переназначились. Как и почему?