Установить предупреждения для стека-драйвера для определенных сообщений об ошибках - PullRequest
0 голосов
/ 05 февраля 2019

Не удается найти чистый способ установки уведомлений Stackdriver об ошибках в облачных функциях

Я использую облачную функцию для обработки данных в облачном хранилище данных.Есть 2 типа ошибок, о которых я хочу получать оповещения:

  1. Технические исключения, которые могут вызвать аварийное завершение функции
  2. Настраиваемые ошибки, которые мы регистрируем из облачной функции

Я сделал следующее,

  • Создал метрику журнала для поиска конкретных ошибок (хотя это не будет работать для «сбоя», поскольку сообщение об ошибке может каждый раз отличаться))
  • Создано оповещение для этой метрики в мониторинге Stackdriver с параметрами, как в разделе кода ниже

Это делается в соответствии с ответом на вопрос, как создать оповещениеза ошибку в стекдрайвере

При первом срабатывании условия я получаю электронное письмо.Тем не менее, о последующих действиях, скажем, на следующий день, я не знаю.Также инцидент находится в «открытом» состоянии.

Resource type: cloud function
Metric:from point 2 above
Aggregation: Aligner: count, Reducer: None, Alignment period: 1m
Configuration: Condition triggers if: Any time series violates, Condition: 
is above, Threshold: 0.001, For: 1 min

Итак, у меня есть 3 вопроса,

  1. Это правильный способ сделать, чтобы удовлетворить мое требование созданияоповещения?

  2. Как я могу получать оповещения о последующих ошибках?

  3. Как установить инцидент как «разрешенный» автоматически или вручную?

1 Ответ

0 голосов
/ 11 февраля 2019

Обычно оповещения разрешаются, как только политика оповещений перестает срабатывать.Проблема, с которой ваши оповещения не разрешаются, заключается в том, что ваша метрика записывает только ненулевые точки - если ошибок нет, она не записывает ноль.Это означает, что политика никогда не получает однозначного сигнала о том, что все в порядке, поэтому предупреждения просто остаются там (они автоматически закрываются через 7 дней, но я думаю, что это не так уж полезно для вас).

Это распространенная проблема, и ее сложно решить.Одна из возможностей - написать свою политику в виде отношения ошибок к чему-то ненулевому, например, к количеству запросов.До тех пор, пока количество запросов не равно нулю, отношение будет вычисляться равным нулю, если ошибок нет, и поэтому предупреждение о соотношении будет автоматически разрешено.Вы должны быть осторожны с ошибками округления, хотя - если количество запросов достаточно велико, вы можете пропустить одну ошибку, потому что отношение может округляться до нуля.

Аарон Шер, инженер Stackdriver

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...