Я хочу вывести из эксплуатации узлы Cassandra, поскольку узлы нуждаются в обновлении версии с 3.9 до 3.11.Я вхожу в конкретный узел и выполняю команду nodetool depmission .
Большинство узлов выводятся из эксплуатации из кластера в течение нескольких часов после операции, но в некоторых случаях вывод из строя застревает, а узел не удаляется из кластера, состояние / состояние: UL.Первоначально данные передаются по разным узлам, и все, кажется, работает нормально, нет журналов ошибок, но через много часов они находятся в том же состоянии.
Я собираюсь проверить успешность вывода из эксплуатации с помощью netstats nodetool и состояние nodetool , выход которого ниже.В обоих местах написано LEAVING
nodetool netstats
Mode: LEAVING
Not sending any streams.
Read Repair Statistics:
Attempted: 62537724
Mismatch (Blocking): 921768
Mismatch (Background): 746828
Pool Name Active Pending Completed Dropped
Large messages n/a 0 44148788 0
Small messages n/a 1 238868718622 143
Gossip messages n/a 0 17713062 0
nodetool status
Datacenter: XXXX
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
-- Address Load Tokens Owns Host ID Rack
UL x.x.x.x 554.42 GiB 256 20.2% b2d0fe01-a0ce-4f41-b410-0dcf4aa7f5ef rack1
Снова после перезапуска службы Cassandra он переходит в состояние UP / NORMAL, и я повторяю тот же процесс до вывода из эксплуатации.Для некоторых узлов он выводится из эксплуатации за одну попытку, а для других требуется несколько попыток для успешного вывода из эксплуатации.
Machine Information: Linux 4.4.0-101-generic x86_64 GNU/Linux
Average Load on each node : ~500GB
Каким должен быть следующий шаг для более эффективного вывода из эксплуатации?