Насколько стабилен RabbitMQ в производстве (с использованием DRBD и Pacemaker)? - PullRequest
1 голос
/ 14 февраля 2011

Ищете опыт работы с RabbitMQ, особенно в конфигурации HA с использованием Pacemaker и DRDB, как рекомендовано здесь: http://www.rabbitmq.com/pacemaker.html

Партия DRBD, в частности, заставляет меня нервничать, поэтому я надеюсь, что кто-то здесь может поделиться своим реальным опытом.

Ответы [ 2 ]

1 голос
/ 16 февраля 2012

Работает большую часть времени.Однако вам придется обратить особое внимание на фехтование (расщепление мозга) при работе с DRBD.В производственной системе всегда трудно решить проблемы такого рода вручную.

Нам не удалось запустить RabbitMQ в режиме master / slave (RA с несколькими состояниями).Мы думали, что увеличим доступность.Мы вернулись к единственному экземпляру сейчас.Если у кого-то еще есть опыт работы с несколькими экземплярами RabbitMQ, работающими одновременно и поддерживающими основную сущность, которой было бы здорово поделиться!

Я считаю, что отсутствие инструментов для отладки Pacemaker в случае проблем - это серьезное препятствие для развертывания в режиме реального временисистемы ... Не всегда понятно, что «думает» или делает Pacemaker.К сожалению, hb_report недостаточно.

Надеюсь, это поможет,

D.

0 голосов
/ 04 сентября 2015

Мы также попробовали конфигурацию master / slave, однако стало трудно поддерживать все экземпляры в актуальном состоянии без простоев. И поверьте мне, вы хотите обновить RabbitMQ. Всегда появляются ошибки либо в самом RabbitMQ, либо в Erlang.

Мы получаем около 100 сбоев в год без каких-либо значимых объяснений в журналах. В журнале ошибок есть просто «ошибка при запуске», вот и все. Иногда он не запускается после сбоя, и в большинстве случаев единственное решение - удалить все постоянные сообщения из всех экземпляров, чтобы состояние очереди было синхронизировано по всему кластеру. В других случаях он будет аварийно завершать работу сразу после запуска и только после нескольких повторных попыток будет загружен правильно. Это означает, что при использовании master / slave нет никакой дополнительной надежности. По крайней мере, в нашем случае их не было. (RabbitMQ 3.5.3, Erlang 18.0)

Это работает для производства, но только если вы храните копию сообщения где-то в журналах или в базе данных, откуда оно может быть быстро восстановлено после серьезного сбоя.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...