Частое сжатие OpsCenter.rollup_state на всех узлах, потребляющих циклы ЦП - PullRequest
0 голосов
/ 03 января 2019

Я использую Datastax Cassandra 4.8.16. С кластером из 8 DC и 5 узлов на каждом DC на виртуальных машинах. За последние пару недель мы наблюдали за проблемой производительности

1) Увеличение количества дропов на виртуальных машинах.

enter image description here

2) LOCAL_QUORUM для некоторых операций записи не достигнут.

3) Частое сжатие OpsCenter.rollup_state и system.hints отображается в Opscenter.

Ценю любую помощь в поиске первопричины для этого.

1 Ответ

0 голосов
/ 03 января 2019

Наличие отброшенных мутаций означает, что кластер сильно перегружен.Это может быть увеличение основной нагрузки, так что это + загрузка из OpsCenter, перегруженной системы - вам нужно посмотреть статистику о количестве запросов, задержках и т. Д. По узлам и по таблицам, чтобы увидеть, где произошло увеличение.Также проверьте статистику ввода / вывода на машинах (например, с iostat) - размеры очередей, задержки чтения / записи и т. Д.

Также рекомендуется использовать выделенный кластер OpsCenter для хранения метрик- он может быть меньшего размера и не требует дополнительной лицензии для DSE.Как сказано в документации OpsCenter :

Важно : в производственных средах DataStax настоятельно рекомендует хранить данные в отдельном кластере DataStax Enterprise.

Относительно виртуальных машин - обычно это не очень рекомендуемая установка, но сильно зависит от того, какое базовое оборудование - количество процессоров, оперативной памяти, дисковой системы.

...