Нестабильность Кассандры, которая вызывает тайм-ауты на запросы - PullRequest
0 голосов
/ 22 мая 2018

Cassandra 3.11.1, кластер из 5 узлов

  1. Все работает хорошо до вчерашнего дня
  2. Но вчера (без видимой причины) мы начинаем получать случайное исключение тайм-аута чтения / записи.Любой запрос может быть выполнен в течение 1 мс, а после этого повторите и Timeout, повторите и снова 1 мс - поэтому приложение не может работать.

Я не администратор (разработчик), но я начинаю искать что-тов nodetool и взгляните на tpstats и его удаленную часть, и то, что я вижу.

Message type           Dropped
READ                       396
RANGE_SLICE                485
_TRACE                  496047
HINT                         0
MUTATION                  1139
COUNTER_MUTATION             0
BATCH_STORE                 28
BATCH_REMOVE                 0
REQUEST_RESPONSE             0
PAGED_RANGE                  0
READ_REPAIR                  0

Для меня - это знак того, что что-то очень и очень неправильно, но я не могу понять, как его диагностировать большеподробно, что является причиной и как ее исправить.

После некоторых экспериментов мы видим, что тайм-аут вызван, если токен принадлежит определенному узлу, например select id from mytable where it = '<token from invalid node>' - он будет завершаться с таймаутом каждые 5 запусков.

Есть где нибудь предложения ???

1 Ответ

0 голосов
/ 23 мая 2018

Некоторая диагностика.

В логах 2 узла спамят друг друга (из system.log) с

2018-05-23 10:05:38,281 INFO  [HintsDispatcher:33] 
HintsDispatchExecutor.java:289 deliver Finished hinted handoff of file 
c53d4133-c681-4903-8399-60dfd8fa786f-1526980061074-1.hints to endpoint 
/111.11.11.111: c53d4133-c681-4903-8399-60dfd8fa786f, partially

много и много.

После перезапуска одногоиз этих узлов были удалены подсказки, и ситуация нормализовалась.

Но до сих пор нет информации - почему это так и как предотвратить ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...