Если вы заботитесь только о запросе в секунду, вам не нужно ничего, связанного с квантилями.
irate(http_server_requests_seconds_count{uri="/your-uri"}[5m])
А если вас интересует общее время отклика:
irate(http_server_requests_seconds_sum{exception="None", uri = "/your-url"}[5m]) / irate(http_server_requests_seconds_count{exception="None", uri = "/your-url"}[5m])
Если вам нужны более точные метрики (квантили), вы можете обратиться к документации Prometheus .
например:
histogram_quantile(0.99, sum(rate(http_server_requests_seconds_bucket{exception="None", uri = "/your-uri"}[5m])) by (le))