В случае 5 узлов в 3 стойках, да, один узел будет находиться под большей нагрузкой / нагрузкой.
Хорошая идея - масштабировать кластер в кратные числа стоек, чтобы сохранить баланс данныхчерез узлы.Например, в кластере с 3 стойками вы должны добавлять 3 узла при каждом расширении кластера.
Если вы решите использовать несколько стоек, идеальное количество стоек должно быть ≥ выбранного вами коэффициента репликации ,Это позволяет Cassandra хранить каждую реплику в отдельной стойке.
В случае сбоя в стойке другие реплики будут по-прежнему доступны.
Например, при RF = 3 и 3 стойках изапросы на QUORUM
, вы можете выдержать сбой одной стойки.Принимая во внимание, что с RF = 3 и 2 стойками на QUORUM
, нет никакой гарантии, что 2 реплики все еще будут доступны в случае отказа стойки.
Стойки предназначены для информирования Cassandra о доменах сбоев.Если вы работаете в своем собственном центре обработки данных, как следует из названия, стойки должны назначаться в зависимости от стойки, в которой находится узел. Если вы работаете в облаке, лучший вариант - сопоставить стойки с доступностью AWS .зоны (или что-то подобное для вашего провайдера).