Кассандра падает при одновременном чтении и записи на EC2 - PullRequest
0 голосов
/ 10 марта 2012

В настоящее время мы используем кластер из 2 узлов кассандры на 2 больших инстансах EC2. Каждый из них имеет около 65G использованных данных. (То же самое для Dev и Production).

Проблема, с которой мы сталкиваемся во время записи в процессе работы - загрузка ЦП становится равной 40+ (2-ядерный компьютер), и в конечном итоге компьютеры становятся недоступными и требуют перезагрузки. Я попробовал несколько «стратегий настройки», таких как уменьшение общего запоминаемого пространства, изменение отношения пространства Эдема к пространству выживания в молодом поколении, копирование более крупного объекта непосредственно из пространства Эдема в старшее поколение, оптимизация сжатия для более частого выполнения с использованием меньшего числа # sstables (я заметил, что во время сбоя использование диска практически не было, поэтому я попытался уменьшить использование памяти).

Глядя на cassandra system.log, я не смог увидеть никаких ОШИБОК или ПРЕДУПРЕЖДЕНИЙ. Единственное, что появляется во время сбоя, это выход StatusLogger.

Если я запускаю записи в кластере Dev, все идет гладко - ошибок нет, нагрузка макс. 1,5-2. Если я перезагружаю 2 рабочих экземпляра, я могу некоторое время запускать операции чтения и записи, прежде чем произойдет сбой, в противном случае, если машины работают более 2 дней, сбой происходит в течение нескольких минут.

Любые предложения, идеи будут высоко оценены.

Спасибо

1 Ответ

0 голосов
/ 16 марта 2012

Ссылка на первое место, которое dmn задал так: http://www.datastax.com/support-forums/topic/cassandra-crashes-during-simultaneous-reads-and-writes-on-ec2

...