Можно ли настроить nagios на отправку уведомлений для каждой группы хостов или сервисной группы? - PullRequest
3 голосов
/ 07 января 2012

Я создал несколько групп хостов в nagios, и каждая группа хостов состоит из нескольких хостов.Хозяева несут приложения, которые проверяются сервисными проверками, всегда не менее 7 или более на приложение.Таким образом, моя проблема заключается в следующем: когда, скажем, приложение на хосте A в группе «Тестирование» отключается, я неожиданно получаю около 7 уведомлений, описывающих, что каждый из 7 элементов управления приложения на хосте A в группе «Тестирование» находится в критическом состоянии.

Я хотел бы настроить nagios для отправки одного уведомления о том, что проверка службы, например, количество сообщений, находится в критическом состоянии на хосте A, а затем максимум еще одно уведомление о том, что группа тестирования "Тестирование" не работает.Таким образом, я не получаю уведомления 7 раз и знаю, что мне нужно исправить проблемы на конкретном хосте в конкретной группе хостов.Таким образом, становится понятнее, какую проблему решить.

Чтобы добавить еще один пример: когда приложение на хосте A выходит из строя и я получаю, скажем, 10 уведомлений, через несколько секунд http_checks также начнет уведомлять меня, потому что apacheне получает данные из приложения, которое не работает.В итоге я решаю одну проблему и получаю около 20 или более уведомлений.Что бы я оценил, так это максимум 4 уведомления.Одна из одной проверки сервиса на хосте A и одна для каждой группы хостов, в которой находится хост A, а затем то же самое для каждой группы хостов, где находится apache.Или, если они находятся в одной и той же группе хостов, их было бы всего 2.

Если бы в другой группе хостов одновременно возникала похожая проблема, я бы снова знал, что есть две группы хостов, которые нужно исправить.Однако текущая ситуация такова, что я получаю около 50 уведомлений и путаюсь, с чего начать и в чем настоящая проблема.

Кто-нибудь из вас сталкивался с подобной проблемой?Я довольно долго искал любую похожую тему, чтобы решить проблему.Я пытался использовать зависимости, но не нашел способа настроить nagios в ситуации, описанной выше.Родительско-дочерние отношения могут использоваться только для каждого хоста.Эскалация вообще не решает эту проблему.

Возможно, я просто пропустил некоторую информацию в документации, касающуюся этой конфигурации.Буду признателен за любые советы.

1 Ответ

1 голос
/ 06 марта 2013

Nagios может сделать это с помощью проверки зависимостей. Смотри: http://nagios.sourceforge.net/docs/nagioscore/3/en/dependencies.html

Но создавать и поддерживать управление очень сложно. Я обнаружил, что самым простым решением было использовать тот факт, что команды NRPE (определенные на целевом хосте) могут выполнять практически неограниченное количество реальных проверок. Все через одну проверку сервиса Nagios. Я «связываю» все проверки для одного приложения (процесс вверх / вниз, различные записи журнала, периоды журналов и т. Д.), Чтобы каждое отдельное приложение имело только одну проверку. Результаты проверки говорят вам, какая проверка не удалась.

...