Кубернетес: Прометей Подсчет количества экземпляров стручка - PullRequest
0 голосов
/ 26 июня 2018

В Java API-интерфейсе Kubernetes-client я могу получить количество доступных и общих развернутых экземпляров pod для данного приложения следующим образом:

ApiClient defaultClient = Configuration.getDefaultApiClient();
AppsV1beta1Api apiInstance = new AppsV1beta1Api();
...
try {
    AppsV1beta1DeploymentList result = apiInstance.listDeploymentForAllNamespaces(_continue, fieldSelector, includeUninitialized, labelSelector, limit, pretty, resourceVersion, timeoutSeconds, watch);
    foreach(ExtensionsV1beta1Deployment extensionsDeployment : result.getItems() ) {
        Map<String, String> labels = extensionsDeployment.getMetadata().getLabels();
        String appName = labels.getOrDefault("app", "");
        ExtensionsV1beta1DeploymentStatus status = extensionsDeployment.getStatus();
        int availablePods = status.getAvailableReplicas();
        int deployedPods = status.getReplicas();
        if ( availablePods != deployedPods) {
             // Generate an alert
        }
    }
} catch (ApiException e) {
    System.err.println("Exception when calling AppsV1beta1Api#listDeploymentForAllNamespaces");
    e.printStackTrace();
}

В приведенном выше примере я сравниваю availablePods с deployedPods, и если они не совпадают, я генерирую предупреждение.

Как я могу воспроизвести эту логику, используя Prometheus, используя правила оповещения и / или конфигурацию Alertmanager, где он проверяет количество доступных экземпляров модуля для данного приложения или задания, и если оно не соответствует указанному количеству экземпляры, это вызовет предупреждение?

Указанный порог может быть общим deployedPods или может быть из другого файла конфигурации или шаблона.

1 Ответ

0 голосов
/ 27 июня 2018

Я не знаю, как это сделать для всех пространств имен, но для одного пространства имен это будет выглядеть так:

curl -k -s 'https://prometheus-k8s/api/v1/query?query=(sum(kube_deployment_spec_replicas%7Bnamespace%3D%22default%22%7D)%20without%20(deployment%2C%20instance%2C%20pod))%20-%20(sum(kube_deployment_status_replicas_available%7Bnamespace%3D%22default%22%7D)%20without%20(deployment%2C%20instance%2C%20pod))'

Это запрос curl к пространству имен по умолчанию.

Конфигурация оповещения будет выглядеть так:

groups:
- name: example
  rules:

  # Alert for any instance that is unreachable for >5 minutes.
  - alert: availablePods!=deployedPods
    expr: (sum(kube_deployment_spec_replicas{namespace="$Name_of_namespace"}) without (deployment, instance, pod)) - (sum(kube_deployment_status_replicas_available{namespace="$Name_of_namespace"}) without (deployment, instance, pod)) != 0
    for: 15m
    labels:
      severity: page
    annotations:
      summary: "availablePods are not equal deployedPods"
      description: "In namespace $Name_of_namespace more than 15 minutes availablePods are not equal deployedPods. "

Не забудьте изменить переменную $Name_of_namespace на имя пространства имен, которое вы хотите проверить.

...