медленный порядок по «полю» и пределу - PullRequest
0 голосов
/ 25 сентября 2018

У меня есть простой запрос, который должен получить 1 запись из таблицы с примерно 14m записями:

EXPLAIN ANALYZE SELECT "projects_toolresult"."id", 
"projects_toolresult"."tool_id", 
"projects_toolresult"."status",
"projects_toolresult"."updated_at",
"projects_toolresult"."created_at" FROM 
"projects_toolresult" WHERE 
("projects_toolresult"."status" = 1 AND 
"projects_toolresult"."tool_id" = 21)
 ORDER BY "projects_toolresult"."updated_at"
 DESC LIMIT 1;

И странно, что когда я упорядочиваю запрос по полю updated_at, мой запрос выполняется 60 секунд.

Limit  (cost=0.43..510.94 rows=1 width=151) (actual
time=56754.932..56754.932 rows=0 loops=1)
->  Index Scan using projects_to_updated_266459_idx on projects_toolresult  (cost=0.43..1800549.09 rows=3527 width=151) (actual time=56754.930..56754.930 rows=0 loops=1)
         Filter: ((status = 1) AND (tool_id = 21))
         Rows Removed by Filter: 13709343  Planning time: 0.236 ms  Execution time: 56754.968 ms (6 rows)

Неважно, будет ли это ASC или DESC

Но если я сделаю ORDER BY RAND() или без заказа:

Limit  (cost=23496.10..23496.10 rows=1 width=151) (actual time=447.532..447.532 rows=0 loops=1)
   ->  Sort  (cost=23496.10..23505.20 rows=3642 width=151) (actual time=447.530..447.530 rows=0 loops=1)
         Sort Key: (random())
         Sort Method: quicksort  Memory: 25kB
         ->  Index Scan using projects_toolresult_tool_id_34a3bb16 on projects_toolresult  (cost=0.56..23477.89 rows=3642 width=151) (actual time=447.513..447.513 rows=0 loops=1)
               Index Cond: (tool_id = 21)
               Filter: (status = 1)
               Rows Removed by Filter: 6097
 Planning time: 0.224 ms
 Execution time: 447.571 ms
(10 rows)

Работает быстро.

У меня есть индекс для полей updated_at и status (я тоже пробовал без него).Я обновил настройки postgres по умолчанию, увеличил значения с помощью этого генератора: https://pgtune.leopard.in.ua/#/

enter image description here

И это то, что происходит, когда этот запрос в действии.

Postgres версия 9.5

Моя таблица и индексы:

id              | integer                  | not null default nextval('projects_toolresult_id_seq'::regclass)
 status          | smallint                 | not null
 object_id       | integer                  | not null
 created_at      | timestamp with time zone | not null
 content_type_id | integer                  | not null
 tool_id         | integer                  | not null
 updated_at      | timestamp with time zone | not null
 output_data     | text                     | not null
Indexes:
    "projects_toolresult_pkey" PRIMARY KEY, btree (id)
    "projects_toolresult_content_type_id_object_i_71ee2c2e_uniq" UNIQUE CONSTRAINT, btree (content_type_id, object_id, tool_id)
    "projects_to_created_cee389_idx" btree (created_at)
    "projects_to_tool_id_ec7856_idx" btree (tool_id, status)
    "projects_to_updated_266459_idx" btree (updated_at)
    "projects_toolresult_content_type_id_9924d905" btree (content_type_id)
    "projects_toolresult_tool_id_34a3bb16" btree (tool_id)
Check constraints:
    "projects_toolresult_object_id_check" CHECK (object_id >= 0)
    "projects_toolresult_status_check" CHECK (status >= 0)
Foreign-key constraints:
    "projects_toolresult_content_type_id_9924d905_fk_django_co" FOREIGN KEY (content_type_id) REFERENCES django_content_type(id) DEFERRABLE INITIALLY DEFERRED
    "projects_toolresult_tool_id_34a3bb16_fk_projects_tool_id" FOREIGN KEY (tool_id) REFERENCES projects_tool(id) DEFERRABLE INITIALLY DEFERRED

1 Ответ

0 голосов
/ 25 сентября 2018

Вы фильтруете свои данные по status и tool_id и сортируете по updated_at, но у вас нет единого индекса для всех этих трех столбцов.

Добавьте индекс, например, так:

CREATE INDEX ON projects_toolresult (status, tool_id, updated_at);

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...