Хроника очереди восстановления жесткого сбоя питания - PullRequest
2 голосов
/ 10 апреля 2020

При записи в Chronicle Queue запись по умолчанию не записывается на диск sh, поэтому я считаю, что все, что находится в кэше грязных страниц ядра linux, потеряно. Каков наилучший подход для гарантированного восстановления в случае сбоя питания? Будет ли хороший подход к использованию рейдового массива с батарейным питанием вместе с принудительным гриппом sh при записи? Или лучше использовать репликацию с подтверждением от второго компьютера, прежде чем предположить, что запись надежно записана? Какой из этих подходов будет иметь лучшую производительность? Теоретически сбой питания может повлиять на обе машины, если они подключены к одной и той же электросети ....

1 Ответ

2 голосов
/ 10 апреля 2020

все, что находится в кэше грязных страниц ядра linux, потеряно.

Да

Каков наилучший подход для получения гарантированного восстановления в случае сбоя питания?

Реплицируйте данные в секунду или третья машина. Таким образом, даже если весь компьютер / центр обработки данных не может быть восстановлен, вы можете продолжить работу без потери данных.

Будет ли хороший рейдовый массив с батарейным питанием вместе с принудительным гриппом sh при записи быть хорошим Подход?

Вы должны доверять надежности оборудования, что Chronicle не может гарантировать, и многие из наших клиентов были сожжены раньше.

Или это Лучше использовать репликацию с подтверждением со второго компьютера, прежде чем предположить, что запись безопасно записана?

Это зависит от ваших требований. По нашему мнению, это лучшая практика, хотя многие клиенты не считают, что им нужна эта опция.

Другой подход заключается в том, чтобы реплицировать данные на вторичный компьютер и обрабатывать данные на вторичном компьютере. Это может уменьшить вдвое задержку в сети.

Какой из этих подходов будет иметь наилучшую производительность?

Наилучшая производительность - предполагать, что в случае сбоя будет использован ручной процесс, и готовы принять небольшую потерю. В этом случае вы обрабатываете все как можно скорее.

Примечание: Есть несколько альтернатив.

  • Вы можете ждать подтверждения только для критических сообщений, другие типы сообщений могут быть обрабатывается немедленно.
  • Вы можете разрешить окно, в котором вы обрабатываете сообщения, если не было подтверждено не более N.

Теоретически сбой питания может повлиять на обе машины, если в той же электросети ....

Здесь вариант 2 + 1 может быть вариантом. Один резервный сервер поблизости для восстановления нормальной работы в случае отказа стойки или ее части. AN - вторая резервная копия вне сайта, которая медленнее копируется, но имеет меньше шансов на сбой.

...