Некоторое время назад наш инструмент мониторинга pgbouncer начал сообщать об ошибках, когда пытался проанализировать отчет show psbouncer.Он жалуется на total_wait_time , чтобы быть слишком высоким, чтобы разобрать его в целое число!ОК, это четкое сообщение.Но что заставляет это число расти?Действительно странно также, как это растет.Разница total_wait_time между несколькими последовательными измерениями остается довольно низкой (несколько палаток или сотен нас), затем постепенно увеличивается на несколько миллиардов (!), а затем снова остается низкой, как показано на графике:
total_wait_time
В настоящее время мы используем pgbouncer в режиме пула сессий с max_pool_size и max_client_connections, установленными на 200. Базовые значения postgres max_connections также установлены на 200. Типичное количество подключенных сессий составляет около 100/130 (большинство из них в состоянии ожидания) и 60 бассейнов.Так что проблем быть не должно ...
В нашей команде show stats есть часть:
| total_wait_time | avg_xact_count | avg_query_count | avg_recv | avg_sent | avg_xact_time | avg_query_time | avg_wait_time
+----------------------+----------------+-----------------+----------+----------+---------------+----------------+---------------
| 11720001435236726705 | 27 | 27 | 16612 | 989853 | 11017 | 11017 | 156
Также ни пользователь, ни приложение не жалуются, ни журналы не показывают ошибки, за исключением этого анализавыпуск.