PostgreSQL медленный запрос - PullRequest
       25

PostgreSQL медленный запрос

0 голосов
/ 26 сентября 2018

Наличие экземпляра OpenVAS (поддерживаемого PostgreSQL), который медленно работает при открытии вкладки «Задачи».

Следующий запрос выполняется в PostgreSQL 22 секунды.Любые предложения, как это можно оптимизировать?

SELECT id, host,
       iso_time (start_time), iso_time (end_time),
       current_port, max_port, report,
       (SELECT uuid FROM reports WHERE id = report),
       (SELECT uuid FROM hosts
        WHERE id = (SELECT host FROM host_identifiers
                    WHERE source_type = 'Report Host'
                      AND name = 'ip'
                      AND source_id = (SELECT uuid FROM reports
                                       WHERE id = report)
                      AND value = report_hosts.host
                    LIMIT 1)
       )
FROM report_hosts
WHERE report = 702;

План

 Index Scan using report_hosts_by_report on report_hosts  (cost=0.42..1975570.99 rows=447 width=38) (actual time=50.042..22979.257 rows=1206 loops=1)
   Index Cond: (report = 702)
   SubPlan 1
     ->  Index Scan using reports_pkey on reports  (cost=0.28..2.49 rows=1 width=37) (actual time=0.004..0.004 rows=1 loops=1206)
           Index Cond: (id = report_hosts.report)
   SubPlan 4
     ->  Index Scan using hosts_pkey on hosts  (cost=4414.37..4416.59 rows=1 width=37) (actual time=0.001..0.001 rows=0 loops=1206)
           Index Cond: (id = $4)
           InitPlan 3 (returns $4)
             ->  Limit  (cost=2.49..4414.09 rows=1 width=4) (actual time=18.998..18.998 rows=0 loops=1206)
                   InitPlan 2 (returns $2)
                     ->  Index Scan using reports_pkey on reports reports_1  (cost=0.28..2.49 rows=1 width=37) (actual time=0.001..0.001 rows=1 loops=1206)
                           Index Cond: (id = report_hosts.report)
                   ->  Seq Scan on host_identifiers  (cost=0.00..4411.60 rows=1 width=4) (actual time=18.997..18.997 rows=0 loops=1206)
                         Filter: ((source_type = 'Report Host'::text) AND (name = 'ip'::text) AND (source_id = $2) AND (value = report_hosts.host))
                         Rows Removed by Filter: 99459
 Planning time: 0.531 ms
 Execution time: 22979.575 ms

Ответы [ 2 ]

0 голосов
/ 27 сентября 2018

Вау!Добавление индекса host_identifiers(source_id, value) именно то, что я искал:

create INDEX host_identifiers_source_id_value on host_identifiers(source_id, value);

Время загрузки страницы для вкладки «Задачи» уменьшилось с 70 с до всего 13 с.

Спасибо!

0 голосов
/ 27 сентября 2018

Все время тратится на 1206 последовательных проверок host_identifiers.

Попробуйте заменить подзапросы на объединения:

SELECT rh.id, rh.host,
       iso_time(rh.start_time), iso_time(rh.end_time),
       rh.current_port, rh.max_port, rh.report,
       r.uuid,
       h.uuid
FROM report_hosts AS rh
   LEFT JOIN reports AS r
      ON rh.report = r.id
   LEFT JOIN host_identifiers AS hi
      ON hi.source_id = r.uuid
         AND hi.value = rh.host
         AND hi.source_type = 'Report Host'
         AND hi.name = 'ip'
   LEFT JOIN hosts AS h
      ON h.id = hi.host
WHERE rh.report = 702;

Это не совсем то же самое, потому что это делаетне учитывайте LIMIT 1, который не имеет смысла без ORDER BY, но он должен быть близок к истине.

Правильные индексы сделают это быстрым (если они еще не существуют):

  • один на reports(id)
  • один на host_identifiers(source_id, value)
  • один на hosts(id)

Ваш запрос трудно прочитать, потому чтоВы не квалифицируете столбцы с именем таблицы.

...