Создание политик оповещений в отчете об ошибках в Stackdriver - PullRequest
0 голосов
/ 30 апреля 2019

У меня есть требование для создания политик оповещения, когда существует 30 исключений тайм-аута соединения. В настоящее время мы генерируем исключение, когда происходит тайм-аут соединения во время вызова веб-службы (потребляет отдыхающие веб-сервисы), поэтому я хочу получать оповещения, когда есть 30 исключений тайм-аута соединения. Есть ли способ, как я могу создать такие политики в Stakdriver. В настоящее время мы используем java8, весеннюю загрузку, google kubernetes engine, ведение журнала в стеке. Я создал метрику под названием SAX-Exception a Когда я пытаюсь создать политики предупреждений для драйвера стека для этой метрики, я не вижу возможности агрегировать количество исключений за определенный период времени.

                         This below image shows how the metrics is defined

enter image description here

На рисунках ниже показано, как определяются политики предупреждений. enter image description here enter image description here enter image description here enter image description here

1 Ответ

1 голос
/ 01 мая 2019

В этом ответе я предполагаю, что ваши ошибки подключения регистрируются в журнале Stackdriver с достаточной детализацией, которая может быть проанализирована Stackdriver.

Ваше программное обеспечение, которое выдает исключение, должно записать это с помощью ведения журнала Stackdriver, если вы хотите использовать Stackdriver Alerting. Добавление кода регистрации Stackdriver очень просто практически на любом языке, включая Java.

Клиентские библиотеки ведения журнала Stackdriver (Java) .

Предполагается, что у вас есть журналы регистрации Stackdriver с необходимыми деталями события:

  • Перейти к ведению журнала Stackdriver.
  • Создайте метрику на основе вашей желаемой ошибки на основе содержимого в ваших записях журнала.

Документация: ссылка .

После создания метрики вы можете создать предупреждение на основе этой метрики. Вы можете агрегировать на основе количества событий за период времени. В вашем случае 30 событий за одну минуту (или все, что вам нужно в качестве индикатора сбоя).

Документация: ссылка .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...