Question

Если у меня есть 4 CPDS с 3 компьютерами в каждом и коэффициентом репликации 3, в котором реализован mapreduce. Какой уровень согласованности вы считаете наиболее подходящим, учитывая, что он быстрый одновременно?

Alex Ott · Answer 1 · 10 мая 2018

Для заданий MapReduce я бы рекомендовал использовать LOCAL_ONE как самый быстрый. Это, конечно, зависит от вашего приложения, но обычно для заданий Spark этот уровень согласованности используется чаще всего.

Но мне очень интересно об этой настройке - в вашем случае у вас есть копия ваших данных на каждой машине. В типичных настройках аналитическая рабочая нагрузка (MapReduce или Spark) обычно помещается в отдельный центр обработки данных, где RF отличается от транзакционного - это дает вам лучшее использование. Например, вы можете объединить 2 DC в один с 6 машинами и использовать RF = 2, чтобы вы могли поместить больше данных в этот DC. Но, конечно, это зависит от требований доступности для ваших заданий MapReduce - вы согласны с некоторым временем простоя, если DC недоступен, или нет.

Уровень последовательности чтения в Кассандре

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Уровень последовательности чтения в Кассандре

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов