Дилемма Рида-Соломона о четности: осколок данных против осколка четности - PullRequest
0 голосов
/ 27 июня 2018

Предполагается кластер 60 drives over 5 nodes с каждым узлом, содержащим 12 дисков.

Что безопаснее?

6 жестких дисков с данными + 2 четных диска = 8 дисков

против

8 дисков данных + 2 четности = 10 дисков

против

9 дисков данных + 3 четности = 12 дисков

против

16 жестких дисков с данными + 4 четных диска = 20 дисков

  • Какой лучший подход для защиты от сбоя одного диска?
  • Какой лучший подход для защиты от отказа одного узла?

Кроме того, если бы вы построили этот мини-кластер, какой паритет вы бы выбрали?

Какая из двух приведенных выше конфигураций больше:

  • Прочное
  • Robust

Кстати, я использую ceph для этого с bluestore. Пожалуйста, не стесняйтесь критиковать.

1 Ответ

0 голосов
/ 03 июля 2018

Я понял, что собираюсь добавить еще один узел в кластер, а затем запустить 8 + 2 на узел, чтобы максимизировать надежность и доступность.

Вероятность отказа одного узла составляет 1 к 6, и даже если узел выходит из строя. С его помощью будет снято 8 данных + 2 паритета.

В CEPH данные могут быть распределены так, чтобы ни у одного узла не было более двух данных фрагментов четности для одного фрагмента данных.

Это позволит узлу выйти из строя и при максимуме убрать 2 сегмента четности или 2 фрагмента данных. Это, хотя и создаст нагрузку на систему восстановления паритетов, вполне безопасно.

Более безопасный вариант - снизить значение до 6 + 2, но это приводит к потере слишком большого количества данных для моего варианта использования.

Я бы опубликовал вероятности, но они сделаны в Excel, и я не знаю, как загрузить Excel здесь.

...