Redis кластер, выполняющий аварийное переключение между главным и подчиненным - PullRequest
0 голосов
/ 19 апреля 2019

У нас есть кластер redis с 4 ведущими и 4 ведомыми.Ведущие 4 находятся на одном физическом хосте, а ведомые на другом физическом хосте.Мы наблюдали частое автоматическое аварийное переключение между ведущим и ведомым, даже если серверы работают и работают (подозревая сбой сети здесь).Как только они перестают работать из-за нового главного ЦП, он загружается и выдает исключение redis Server (как прикрепленный снимок экрана), отключая клиенты.Ниже приведены сведения об узле кластера:

6adb459bc1cda0ae002109140d04015c531c6910 10.10.52.38:6379 slave 0060ee610b3a52bf88a0202aff0ce63039354578 0 1555648709383 58 connected
46f38129c861ff775badc67cc869493ee28fd166 10.10.52.44:6379 slave 19538764e5cde1014f1fd35afbf1af3a217de7b4 0 1555648708378 66 connected
1833427e42afa74273aa33696ed7e5f80f40e244 10.10.52.40:6379 master - 0 1555648706367 63 connected 6827-9556 15018-16383
a0f14e54f18e1a04c448cd09e851459863e929b0 10.10.52.42:6379 slave d190c341144350bf9dbad67841104ed75ccbdcdc 0 1555648710388 65 connected
0060ee610b3a52bf88a0202aff0ce63039354578 10.10.52.37:6379 master - 0 1555648704357 58 connected 2730-5460 13653-15017
b702bbcddb6a39e2deb8567804fa5d4468fbe5cc 10.10.52.39:6379 slave 1833427e42afa74273aa33696ed7e5f80f40e244 0 1555648708879 63 connected
d190c341144350bf9dbad67841104ed75ccbdcdc 10.10.52.41:6379 master - 0 1555648710385 65 connected 9557-13652
19538764e5cde1014f1fd35afbf1af3a217de7b4 10.10.52.43:6379 myself,master - 0 0 66 connected 0-2729 5461-6826

Также сведения о конфигурации кластера:

1) "cluster-node-timeout"
2) "15000"
3) "cluster-migration-barrier"
4) "1"
5) "cluster-slave-validity-factor"
6) "10"
7) "cluster-require-full-coverage"
8) "yes"

Прилагается журнал одного из ведомых: https://pastebin.com/GS8ChyeH

Конфигурация правильная?Как мы можем предотвратить это?enter image description here

...