Я выполнил команду sjk (swiss java kill) на узле cassandra, чтобы исследовать высокую нагрузку на DC:
. / Nodetool sjk ttop -o CPU -n 20
получил следующий вывод:
Process summary
process cpu=177.48%
application cpu=154.86% (user=126.50% sys=28.35%)
other: cpu=22.62%
thread count: 568
heap allocation rate 224mb/s
[1052346] user=48.79% sys= 1.73% alloc= 162mb/s - CompactionExecutor:1351
[1054022] user=10.61% sys= 0.47% alloc= 31mb/s - MemtableFlushWriter:40483
[000496] user= 7.70% sys= 2.66% alloc= 2592kb/s - SharedPool-Worker-1
[000498] user= 7.49% sys= 2.13% alloc= 2184kb/s - SharedPool-Worker-2
[000665] user= 6.45% sys= 2.02% alloc= 2165kb/s - SharedPool-Worker-3
[000666] user= 5.72% sys= 1.93% alloc= 1887kb/s - SharedPool-Worker-4
[1054020] user= 4.47% sys= 2.46% alloc= 3909kb/s - RMI TCP Connection(90985)-xx.xx.xx.xx
[000670] user= 5.31% sys= 1.47% alloc= 1611kb/s - SharedPool-Worker-5
[000669] user= 3.85% sys= 1.08% alloc= 1324kb/s - SharedPool-Worker-6
Эта строка
[1052346] пользователь = 48,79% sys = 1,73% alloc = 162 МБ / с -
CompactionExecutor: 1351
показывает, что уплотнение беспокоит узел.
На самом деле, я вижу частые уплотнения в таблице OpsCenter.rollup_state.
Как действовать дальше и что мне следует расследовать, чтобы выяснить причину этого?
Также может помочь увеличение числа concurrent_compactors ?