Загрузочный узел узла Cassandra 2.0.11 зависает в состоянии UJ - PullRequest
0 голосов
/ 10 октября 2018

Мы работаем над добавлением узла в существующий кластер Cassandra 2.0.11.Начав с добавления узла, я рассчитал, что узел будет складывать около 616 ГБ данных с других узлов в кластере.Потоковая передача данных прошла хорошо.Теперь, собрав 618 ГБ данных, уже более 24 часов узел по-прежнему зависает в состоянии UJ.

Статус Nodetool:

UJ  xx.xxx.xxx.xxx  621.87 GB  256     ?      54a80605-9209-4e1c-9e61-3250e4458797  RAC1

Netstoats Nodetool:

Кажется, что присоединяющийся узел выполняет потоковую передачу 346 файлов с другого существующего узла yy.yyy.yy.yy за последние 24 часа, но system.logs не показывает никаких потоковых действий

-bash-4.1$ nodetool netstats | grep -v 100%
Mode: JOINING
Bootstrap 365e5830-cac9-11e8-bea5-fdb60ab1bc98
 /yy.yyy.yy.yy
        Receiving 346 files, 228835212751 bytes total

Чтение статистики восстановления:

Attempted: 0
Mismatch (Blocking): 0
Mismatch (Background): 0
Pool Name                    Active   Pending      Completed
Commands                        n/a         0             16
Responses                       n/a         0      202529576

В настоящее время мы включили DEBUG в system.log для перехвата, если что-то застряло.

Текущий system.log:

 DEBUG [MutationStage:208] 2018-10-10 10:51:48,657 AbstractSimplePerColumnSecondaryIndex.java (line 111) applying index row xxxxxxxxxxxxxxxxxxxx in ColumnFamily(abcdefgh_ijklmno.pqr_stu_vwxyz [38643266636162312d643430312d343431652d623535652d333664376531626331343066:187181334195211023047137388  16203108:false:0@1539148904830000,])

Я пыталсявыяснить, что именно делает Кассандра.Что именно AbstractSimplePerColumnSecondaryIndex.java делает.

Поиск исходного кода, который я нашел ниже для описания AbstractSimplePerColumnSecondaryIndex.java:

Реализация вторичного индекса для семейства столбцов с использованием второго столбцасемейство, в котором ключи строк являются индексированными значениями, а имена столбцов являются базовыми ключами строки.

Если я выведу согласно терминам непрофессионала, эти журналы предполагают, что создается индекс (вторичный_индекс). У нас есть дополнительный индекс индексадля многих столов.Тем не менее, я могу утверждать, что это не так, поскольку мы ничего не видим в уплотнениях nodetool:

-bash-4.1$ nodetool compactionstats
pending tasks: 0
Active compaction remaining time :        n/a

Пожалуйста, помогите с 3 вещами:

  1. Что должно быть идеальным решением для этого сценариягде присоединяющийся узел находится в подвешенном состоянии с тех пор.Я нашел это в сети ( Узел Кассандры не может завершить операцию присоединения ).Предложите, если это необходимо сделать
  2. В этих сценариях будет полезен анализ дампа потока, чтобы выяснить, какой поток действительно застрял.
  3. Также просьба помочь с тем, что именно происходитв system.log сейчас.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...