Как искать в разделенной таблице в Postgres? - PullRequest
2 голосов
/ 05 апреля 2020
CREATE TABLE IF NOT EXISTS tasks
(
    id bigint not null,
    created_date timestamp not null,
    status_code integer,
    target_identity varchar(255),
    updated_date timestamp,
    UNIQUE (created_date, target_identity)
) PARTITION BY RANGE (created_date);
CREATE TABLE IF NOT EXISTS tasks2020_04 PARTITION OF tasks FOR VALUES FROM ('2020-04-01') TO ('2020-05-01');
CREATE INDEX IF NOT EXISTS idx_task_created_date ON tasks2020_04 (created_date);
CREATE TABLE IF NOT EXISTS tasks2020_05 PARTITION OF tasks FOR VALUES FROM ('2020-05-01') TO ('2020-06-01');
CREATE INDEX IF NOT EXISTS idx_task_created_date ON tasks2020_05 (created_date);
CREATE TABLE IF NOT EXISTS tasks2020_06 PARTITION OF tasks FOR VALUES FROM ('2020-06-01') TO ('2020-07-01');
CREATE INDEX IF NOT EXISTS idx_task_created_date ON tasks2020_06 (created_date);
CREATE TABLE IF NOT EXISTS tasks2020_07 PARTITION OF tasks FOR VALUES FROM ('2020-07-01') TO ('2020-08-01');
CREATE INDEX IF NOT EXISTS idx_task_created_date ON tasks2020_07 (created_date);

Раздел создан, ошибок нет. Это хорошо.

Но проблема в том, что когда я выполняю этот запрос

SET enable_partition_pruning = on;
EXPLAIN ANALYZE select * from tasks p
where p.created_date >= DATE '2020-04-01' AND p.target_identity in ('identity')

Он выполняет поиск по каждому разделу. объяснить, проанализировать:

    "QUERY PLAN"
"Append  (cost=0.14..206.16 rows=24 width=560) (actual time=0.072..0.072 rows=0 loops=1)"
"  ->  Index Scan using tasks2020_04_created_date_target_identity_key on tasks2020_04 p  (cost=0.14..8.58 rows=1 width=560) (actual time=0.009..0.009 rows=0 loops=1)"
"        Index Cond: ((created_date >= '2020-04-01'::date) AND ((target_identity)::text = 'identity'::text))"
"  ->  Index Scan using tasks2020_05_created_date_target_identity_key on tasks2020_05 p_1  (cost=0.14..8.58 rows=1 width=560) (actual time=0.002..0.003 rows=0 loops=1)"
"        Index Cond: ((created_date >= '2020-04-01'::date) AND ((target_identity)::text = 'identity'::text))"
"  ->  Index Scan using tasks2020_06_created_date_target_identity_key on tasks2020_06 p_2  (cost=0.14..8.58 rows=1 width=560) (actual time=0.002..0.002 rows=0 loops=1)"
"        Index Cond: ((created_date >= '2020-04-01'::date) AND ((target_identity)::text = 'identity'::text))"
"  ->  Index Scan using tasks2020_07_created_date_target_identity_key on tasks2020_07 p_3  (cost=0.14..8.58 rows=1 width=560) (actual time=0.002..0.002 rows=0 loops=1)"

почему? может быть, какой-то индекс отсутствует?

на этом сайте, https://postgrespro.ru/docs/postgresql/12/ddl-partitioning#DDL -PARTITION-PRUNING , я делаю точно так же

это с сайта: SET enable_partition_pruning = on;

EXPLAIN SELECT count(*) FROM measurement WHERE log_date >= DATE '2008-01-01';
                                    QUERY PLAN
-----------------------------------------------------------------------------------
 Aggregate  (cost=37.75..37.76 rows=1 width=8)
   ->  Seq Scan on measurement_y2008m01  (cost=0.00..33.12 rows=617 width=0)
         Filter: (log_date >= '2008-01-01'::date)

версия: PostgreSQL 12.0 (Debian 12.0-2.pgdg100 + 1) в x86_64-p c - linux -gnu, скомпилированная g cc (Debian 8.3.0-6) 8.3. 0, 64-битный

1 Ответ

2 голосов
/ 05 апреля 2020

Упомянутый пример не тот, потому что предложение WHERE позволяет сканировать только один раздел: последний. Здесь все наоборот: сканирование разделов ожидается, потому что все сканируемые разделы соответствуют условию p.created_date >= DATE '2020-04-01. Чтобы избежать этого, вам нужно дать предложение WHERE, ограничивающее список разделов, например:

EXPLAIN ANALYZE select * from tasks p
where 
    p.created_date >= DATE '2020-04-01' 
AND p.created_date <= DATE '2020-04-30' 
AND p.target_identity in ('identity');
                                                               QUERY PLAN                                                               
----------------------------------------------------------------------------------------------------------------------------------------
 Index Scan using idx_task_created_date on tasks2020_04 p  (cost=0.14..8.17 rows=1 width=544) (actual time=0.004..0.004 rows=0 loops=1)
   Index Cond: ((created_date >= '2020-04-01'::date) AND (created_date <= '2020-04-30'::date))
   Filter: ((target_identity)::text = 'identity'::text)
 Planning Time: 0.182 ms
 Execution Time: 0.018 ms
(5 rows)

Или (этот запрос больше соответствует приведенному примеру: сканировать только последний существующий раздел):

EXPLAIN ANALYZE select * from tasks p
where 
    p.created_date >= DATE '2020-07-01' 
AND p.target_identity in ('identity');
                                                                           QUERY PLAN                                                                           
----------------------------------------------------------------------------------------------------------------------------------------------------------------
 Index Scan using tasks2020_07_created_date_target_identity_key on tasks2020_07 p  (cost=0.14..8.62 rows=1 width=544) (actual time=0.004..0.005 rows=0 loops=1)
   Index Cond: ((created_date >= '2020-07-01'::date) AND ((target_identity)::text = 'identity'::text))
 Planning Time: 0.074 ms
 Execution Time: 0.018 ms
(4 rows)
...