Узел Cassandra застревает после вывода из эксплуатации nodetool - PullRequest
0 голосов
/ 12 июня 2018

Я хочу вывести из эксплуатации узлы Cassandra, поскольку узлы нуждаются в обновлении версии с 3.9 до 3.11.Я вхожу в конкретный узел и выполняю команду nodetool depmission .

Большинство узлов выводятся из эксплуатации из кластера в течение нескольких часов после операции, но в некоторых случаях вывод из строя застревает, а узел не удаляется из кластера, состояние / состояние: UL.Первоначально данные передаются по разным узлам, и все, кажется, работает нормально, нет журналов ошибок, но через много часов они находятся в том же состоянии.

Я собираюсь проверить успешность вывода из эксплуатации с помощью netstats nodetool и состояние nodetool , выход которого ниже.В обоих местах написано LEAVING

nodetool netstats Mode: LEAVING Not sending any streams. Read Repair Statistics: Attempted: 62537724 Mismatch (Blocking): 921768 Mismatch (Background): 746828 Pool Name Active Pending Completed Dropped Large messages n/a 0 44148788 0 Small messages n/a 1 238868718622 143 Gossip messages n/a 0 17713062 0 nodetool status Datacenter: XXXX Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns Host ID Rack UL x.x.x.x 554.42 GiB 256 20.2% b2d0fe01-a0ce-4f41-b410-0dcf4aa7f5ef rack1

Снова после перезапуска службы Cassandra он переходит в состояние UP / NORMAL, и я повторяю тот же процесс до вывода из эксплуатации.Для некоторых узлов он выводится из эксплуатации за одну попытку, а для других требуется несколько попыток для успешного вывода из эксплуатации.

Machine Information: Linux 4.4.0-101-generic x86_64 GNU/Linux
Average Load on each node : ~500GB

Каким должен быть следующий шаг для более эффективного вывода из эксплуатации?

1 Ответ

0 голосов
/ 12 июня 2018

Другой подход к выводу узла из эксплуатации заключается в остановке узла и запуске removenode nodetool в другом работающем узле.Это назначит диапазоны токенов другим узлам, и вы можете просто удалить данные удаленного узла.Вы можете использовать nodetool removenode, если у вас есть коэффициент репликации> 1, что означает, что ваши данные будут доступны и на других узлах.В вашем случае, если вы удаляете несколько узлов, это зависит от значения вашего коэффициента репликации.

...