масштабирование Кассандры лучше описывается в терминах закона Густафсона , а не закона Амдала . При масштабировании по Гастафсону показывает, сколько данных можно обработать при увеличении количества узлов. То есть, если у вас в N раз больше узлов, вы можете обработать набор данных в N раз больше за то же время.
Это возможно, потому что Кассандра использует очень мало координации для всего кластера, за исключением изменений схемы и кольца. В большинстве операций используется только количество узлов, равное коэффициенту репликации, который остается постоянным по мере роста набора данных - следовательно, почти линейный масштаб.
В отличие от этого, при масштабировании по Амдалю оценивается, насколько быстрее вы можете обрабатывать фиксированный набор данных при увеличении количества узлов. То есть, если у вас в N раз больше узлов, можете ли вы обрабатывать один и тот же набор данных в N раз быстрее?
Очевидно, что в какой-то момент вы достигнете предела, когда добавление большего количества узлов не сделает ваши запросы быстрее, поскольку для обслуживания запроса требуется минимальное количество времени. Кассандра здесь не линейна.
В вашем случае звучит так, будто вы спрашиваете, лучше ли иметь 1000 медленных узлов или 200 быстрых. Насколько большой ваш набор данных? Это зависит от вашей рабочей нагрузки, но, как правило, рекомендуется, чтобы оптимальный размер узлов составлял около 1 ТБ данных каждый, что гарантирует наличие достаточного объема ОЗУ и ЦП для соответствия (см. Ограничения узлов кассандры ). 1000 звучит как слишком много, если только у вас нет петабайт данных.