Кассандра репликации или рейд - PullRequest
6 голосов
/ 29 августа 2011

В традиционных СУБД мы в большинстве случаев привыкли к RAID10, но если использовать cassandra RF = 2, то в качестве резервной копии у нас точно будет одна копия, тогда в этом случае почему бы не использовать RAID10.

Я думаю, что это уменьшит накладные расходы от Кассандры для репликации ..

Кроме того, в RAID10, если происходит сбой жесткого диска, весь узел будет продолжать работать, но если будет использована репликация, то один сбой жесткого диска приведет к отключению всего узла?

Хотя я думаю, что при использовании RAID10 на каждую запись будут накладные расходы, но сброс выполняется, когда SSTABLE заполнен, поэтому он не будет ощущаться все время ..

1 Ответ

5 голосов
/ 29 августа 2011

Я бы сказал, что RAID 10 - пустая трата денег. Две причины:

1) Одним из важных атрибутов BigTable (Cassandra или HBase) является возможность быстрого и дешевого расширения вашего кластера или добавления избыточности путем добавления новых серверов. Исходя из недавних цен, RAID 10 (чередование и связывание) настолько дорог, что он практически такой же, как добавление еще одного целого сервера с хранилищем JBOD.

2) Репликация Cassandra защищает вас от сбоя компьютера, а не только от сбоя диска. RAID 10 не защитит вас, если ваш процессор умирает, но репликация Cassandra подойдет. Это также защитит вас от сбоя диска и позволит нескольким клиентам читать с нескольких узлов, предотвращая горячие точки.

...