Запрос тайм-аута экспортера чёрного ящика Прометея - PullRequest
0 голосов
/ 18 декабря 2018

У меня есть некоторые проблемы с blackbox_exporter следующим образом:
Я настроил prometheus.yml следующим образом:

global:
    scrape_interval:     30s
    scrape_timeout:      5s
    evaluation_interval: 30s

scrape_configs:
############################################################
###################### node exporter #######################
############################################################
  - job_name: 'Demo'
    static_configs:
        - targets: ['127.0.0.1:9100']
############################################################
##################### blackbox exporter ####################
############################################################
  - job_name: 'blackbox'
    metrics_path: /probe
    params:
      module: [http_post_2xx]
    static_configs:
    - targets:
######################## Test ##############################
      - 127.0.0.1:2014/translate
############################################################
    relabel_configs:
      - source_labels: [__address__]
        target_label: __param_target
      - source_labels: [__param_target]
        target_label: instance
      - target_label: __address__
        replacement: 127.0.0.1:9115
############################################################

И мой blackbox_exporter.yml:

modules:
  http_post_2xx:
    prober: http
    timeout: 10s
    http:
      method: POST
      headers:
        Content-Type: application/json
      body: '{"text": "hi"}'

Когда явизуализируйте результат с моего целевого сервера по графике, все хорошо.Проверка запроса возвращает значение 0, 200 или 500?Отлично, по крайней мере, он способен изменить себя, какой сервер не работает, прежде чем получать жалобы от клиентов.Спасибо, Прометей и графана.:)

Вот еще одна ситуация, которая меня беспокоит в эти несколько дней, когда я пытаюсь использовать инструмент тестирования производительности wrk-HTTP для измерения производительности серверов.Я хочу знать, насколько хорошо мои серверы могут справиться с «массовой атакой» со стороны wrk:

sudo wrk -t4 -c2000 -d20m -T10s --script=post.lua --latency http://10.0.100.199:2001/translate

, а post.lua:

wrk.method = "POST"
wrk.headers["Content-Type"] = "application/json"
wrk.body = '{"text": "日本国民は、正当に選挙された国会における代表者を通じて行動し"}'

Blackbox_exporter не может получить probe_http_status_code, когдасервер находится под таким большим давлением со стороны wrk.Probe_http_status_code станет 0, но я хочу четко отделить эти ситуации:

  1. Запрос был отправлен, но сервер не может обработать этот запрос, так как он находится под большим "давлением".(Я предполагаю, что это ситуация тайм-аута для сервера.)
  2. Сервер не работает, вообще не может обработать любой запрос.

Оба условия probe_http_status_code будут представлены в Prometheus как 0. Есть ли способ разделения этих условий?

...