В чем разница между сканированием Seq и растровым просмотром кучи в postgres? - PullRequest
48 голосов
/ 04 января 2009

В выводе команды объяснения я обнаружил два термина: «Сканирование Seq» и ​​«Сканирование битовой карты». Может кто-нибудь сказать мне, в чем разница между этими двумя типами сканирования? (Я использую PostgreSql)

1 Ответ

68 голосов
/ 04 января 2009

http://www.postgresql.org/docs/8.2/static/using-explain.html

По существу, последовательное сканирование идет к фактическим строкам, и начинается чтение со строки 1 и продолжается до тех пор, пока не будет выполнен запрос (это может быть не вся таблица, например, в случае ограничения)

Сканирование кучи растровых изображений означает, что PostgreSQL обнаружил небольшое подмножество строк для выборки (например, из индекса) и собирается извлечь только эти строки. Это, конечно, приведет к гораздо большему поиску, поэтому будет быстрее, только когда ему потребуется небольшое подмножество строк.

Взять пример:

create table test (a int primary key, b int unique, c int);
insert into test values (1,1,1), (2,2,2), (3,3,3), (4,4,4), (5,5,5);

Теперь мы можем легко получить следующую проверку:

explain select * from test where a != 4

                       QUERY PLAN                        
---------------------------------------------------------
 Seq Scan on test  (cost=0.00..34.25 rows=1930 width=12)
   Filter: (a <> 4)

Он сделал последовательное сканирование, потому что оценивает, что он собирается захватить большую часть таблицы; пытаться сделать это (вместо большого бесполезного чтения) было бы глупо.

Теперь мы можем использовать индекс:

explain select * from test where a = 4 ;
                              QUERY PLAN                              
----------------------------------------------------------------------
 Index Scan using test_pkey on test  (cost=0.00..8.27 rows=1 width=4)
   Index Cond: (a = 4)

И, наконец, мы можем получить некоторые растровые операции:

explain select * from test where a = 4 or a = 3;
                                  QUERY PLAN                                  
------------------------------------------------------------------------------
 Bitmap Heap Scan on test  (cost=8.52..13.86 rows=2 width=12)
   Recheck Cond: ((a = 4) OR (a = 3))
   ->  BitmapOr  (cost=8.52..8.52 rows=2 width=0)
         ->  Bitmap Index Scan on test_pkey  (cost=0.00..4.26 rows=1 width=0)
               Index Cond: (a = 4)
         ->  Bitmap Index Scan on test_pkey  (cost=0.00..4.26 rows=1 width=0)
               Index Cond: (a = 3)

Мы можем прочитать это как:

  1. Создайте растровое изображение строк, которые мы хотим для a = 4. (Сканирование растрового индекса)
  2. Создайте растровое изображение строк, которые мы хотим для a = 3. (Сканирование растрового индекса)
  3. Или два растровых изображения вместе (BitmapOr)
  4. Просмотрите эти строки в таблице (Сканирование кучи растрового изображения) и убедитесь, что a = 4 или a = 3 (перепроверьте cond)

[Да, эти планы запросов глупы, но это потому, что мы не смогли проанализировать test Если бы мы проанализировали это, все они были бы последовательными сканированиями, поскольку есть 5 крошечных строк]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...