Вы должны использовать Logs Viewer и создать фильтр:
В качестве ресурса вы должны выбрать GKE Cluster Operations
и добавить фильтр.
Фильтр может выглядеть так:
resource.type="k8s_cluster"
resource.labels.cluster_name="<CLUSTER_NAME>"
resource.labels.location="<CLUSTR_LOCATION>"
jsonPayload.reason="Killing"
После этого создайте пользовательскую метрику, нажав кнопку Create metric
.
Затем вы можете Create alert from metric
, нажав на созданную метрику в Logs-based metrics
.
Затем настройтеa Конфигурация для триггеров, условий и порога.
Что касается правильного порога, я бы взял среднее количество перезапусков за прошедший период времени и сделал бы его немного больше для оповещения.