Странная медленная производительность в MySQL репликации - PullRequest
0 голосов
/ 16 мая 2018

У меня есть мастер MySQL (MariaDB 10.1.27), который содержит ~ 1900 баз данных.Общий размер базы данных ~ 100 ГБ Используется движок InnoDB с innodb_file_per_table = 1

Я собираюсь настроить два ведомых для этого сервера (MariaDB 10.1.27).Оба раба с одинаковым оборудованием, как мастер.мастер остановился в полночь, сделал резервную копию из / var / lib / mysql с помощью tar, и этот tar был перенесен и извлечен на двух отдельных серверах.

Один ведомый установил быстро и перехватил мастер (задержка 1 день)) через ~ 1 час.Во время догонялки я получил 100% загрузку ЦП (LA 3-4) с журналом активности диска (~ 20% wa)

У второго ведомого устройства есть некоторая странная проблема с производительностью репликации.После настройки его догоняет мастер более 2 дней.И продолжается только 20%.текущее состояние подчиненного шоу:

show slave status\Gshow processlist;
*************************** 1. row ***************************
               Slave_IO_State: Waiting for master to send event
                  Master_Host: XXXXXXXXXX
                  Master_User: XXXXXXXX
                  Master_Port: 3306
                Connect_Retry: 60
              Master_Log_File: mysqld-bin.000572
          Read_Master_Log_Pos: 524619108
               Relay_Log_File: relay-bin.000004
                Relay_Log_Pos: 916671538
        Relay_Master_Log_File: mysqld-bin.000571
             Slave_IO_Running: Yes
            Slave_SQL_Running: Yes
              Replicate_Do_DB:
          Replicate_Ignore_DB:
           Replicate_Do_Table:
       Replicate_Ignore_Table:
      Replicate_Wild_Do_Table:
  Replicate_Wild_Ignore_Table: apsc.%,billing.%,information_schema.%,performance_schema.%,horde.%,mysql.%,phpmyadmin_gmRJC4rn_tom.%,psa.%,roundcubemail.%,sitebuilder5.%
                   Last_Errno: 0
                   Last_Error:
                 Skip_Counter: 0
          Exec_Master_Log_Pos: 916671245
              Relay_Log_Space: 1598365917
              Until_Condition: None
               Until_Log_File:
                Until_Log_Pos: 0
           Master_SSL_Allowed: No
           Master_SSL_CA_File:
           Master_SSL_CA_Path:
              Master_SSL_Cert:
            Master_SSL_Cipher:
               Master_SSL_Key:
        Seconds_Behind_Master: 24730
Master_SSL_Verify_Server_Cert: No
                Last_IO_Errno: 0
                Last_IO_Error:
               Last_SQL_Errno: 0
               Last_SQL_Error:
  Replicate_Ignore_Server_Ids:
             Master_Server_Id: 111
               Master_SSL_Crl:
           Master_SSL_Crlpath:
                   Using_Gtid: No
                  Gtid_IO_Pos:
      Replicate_Do_Domain_Ids:
  Replicate_Ignore_Domain_Ids:
                Parallel_Mode: conservative
1 row in set (0.00 sec)

Нет серьезных действий на процессоре и на диске (см. верхний экран позже)

======
top - 03:36:36 up 114 days, 12:26,  9 users,  load average: 1.82, 1.86, 1.89
Tasks: 364 total,   1 running, 362 sleeping,   0 stopped,   1 zombie
Cpu(s):  1.5%us,  0.7%sy,  0.0%ni, 87.7%id, 4.0%wa,  0.0%hi,  0.0%si,  0.0%st
Mem:  32993560k total, 32271192k used,   722368k free,   625464k buffers
Swap:  4194296k total,   229512k used,  3964784k free, 23100280k cached

  PID USER      PR  NI  VIRT  RES  SHR S %CPU %MEM    TIME+  COMMAND
13809 mysql      1 -19 6819m 5.8g 7332 S 8.9 18.5 132:12.33 mysqld
======

Как я вижу, все журналы бинов передаются от главного к подчиненномув настоящее время, но ведомый имеет низкую производительность в применении этого журнала к базе данных.

В журнале медленных запросов (ограничение 2 секунды) у меня нет никаких записей.

Проблема с поиском не помогает.Уже пробовал:

skip-name-resolve

innodb_flush_log_at_trx_commit=0
innodb-flush-method=O_DIRECT

#move innodb logs to SSD
nnodb_log_group_home_dir=/var/lib/mysql_logs

Попытка установки многопоточной репликации (2 и 4 потока) не удалась, поскольку процесс замедлялся больше текущего состояния.У ведомого устройства наблюдается увеличение задержки (Seconds_Behind_Master в состоянии show slave)

Пожалуйста, сообщите мне, что может быть источником проблемы и что можно сделать для ускорения репликации.

...