Агрегатная функция sum () и count (Distinct ()) занимает больше минуты, чтобы вернуть результат в influenxsql - PullRequest
2 голосов
/ 14 октября 2019

Я выполняю один запрос infxSQL, который возвращает результат более чем за 1 минуту. Запрос:

select SUM(call_duration) as total_duration,Count(Distinct(recipient_id)) as total_recipients from xyz where target_id = '1';

Отдельные запросы, такие как

select Count(Distinct(recipient_id)) as total_recipients from xyz where target_id = '1';

select SUM(call_duration) as total_duration from xyz where target_id = '1';

, также требуют более 1 минуты для возврата.

при запросе

select MAX(call_duration), MIN(call_duration) from xyz where target_id = '1';

Возвращать результаты очень быстро, за секунды, как за 3-4 секунды.

таблица (измерения) xyz очень велика. Есть более 10 миллионов записей, которые соответствуют этому условию. call_duration и receient_id являются полями, а target_id является тегом

Хотя функции MIN и MAX возвращают результаты очень быстро, я подозреваю, почему SUM занимает больше времени?

Версия InfluxDB: 1.7.4 Конфигурация машины - AWSEC2 - t2.medium (4 ГБ ОЗУ)

Файл конфигурации:

[meta]
dir = "/var/lib/influxdb/meta"
[data]
dir = "/var/lib/influxdb/data"
wal-dir = "/var/lib/influxdb/wal"
series-id-set-cache-size = 100
[coordinator]
[retention]
[shard-precreation]
[monitor]
[http]
enabled = true
auth-enabled = true
log-enabled = true
access-log-path = "/var/log/influxdb/http_access.log"
write-tracing = false
max-body-size = 0
max-concurrent-write-limit = 0
[logging]
[subscriber]
[[graphite]]
[[collectd]]
[[opentsdb]]
[[udp]]
[continuous_queries]
[tls]

Я думаю, что результат должен быть возвращен через 5-6 секунд

EXPLAIN select MIN(call_duration) from xyz where target_id='1';
QUERY PLAN
----------
EXPRESSION: min(call_duration::float)
NUMBER OF SHARDS: 21
NUMBER OF SERIES: 85134
CACHED VALUES: 0
NUMBER OF FILES: 24642
NUMBER OF BLOCKS: 31608
SIZE OF BLOCKS: 65520278

EXPLAIN select MAX(call_duration) from xyz where target_id='1';
QUERY PLAN
----------
EXPRESSION: max(call_duration::float)
NUMBER OF SHARDS: 21
NUMBER OF SERIES: 85134
CACHED VALUES: 0
NUMBER OF FILES: 24642
NUMBER OF BLOCKS: 31608
SIZE OF BLOCKS: 65520278

EXPLAIN select SUM(call_duration) as total_call_duration from xyz where target_id='1';
QUERY PLAN
----------
EXPRESSION: sum(call_duration::float)
NUMBER OF SHARDS: 21
NUMBER OF SERIES: 85134
CACHED VALUES: 0
NUMBER OF FILES: 24642
NUMBER OF BLOCKS: 31608
SIZE OF BLOCKS: 65520278

EXPLAIN select Count(Distinct(recipient_id)) as total_recipients from xyz where target_id='1';
QUERY PLAN
----------
EXPRESSION: recipient_id::integer
NUMBER OF SHARDS: 21
NUMBER OF SERIES: 85134
CACHED VALUES: 0
NUMBER OF FILES: 24642
NUMBER OF BLOCKS: 31608
SIZE OF BLOCKS: 82448255
...