Переформатирование вашего плана запроса для ясности:
QUERY PLAN Aggregate (cost=126377.96..126377.97 rows=1 width=0)
-> Hash Join (cost=6014.51..126225.38 rows=61033 width=0)
Hash Cond: (contacts_lists.contact_id = plain_contacts.contact_id)
-> Hash Join (cost=3067.30..121828.63 rows=61033 width=8)
Hash Cond: (contacts_lists.contact_id = contacts.id)
-> Index Scan using index_contacts_lists_on_list_id_and_contact_id
on contacts_lists (cost=0.00..116909.97 rows=61033 width=4)
Index Cond: (list_id = 66996)
-> Hash (cost=1721.41..1721.41 rows=84551 width=4)
-> Seq Scan on contacts (cost=0.00..1721.41 rows=84551 width=4)
Filter: ((NOT email_bad) AND (NOT email_unsub))
-> Hash (cost=2474.97..2474.97 rows=37779 width=4)
-> Seq Scan on plain_contacts (cost=0.00..2474.97 rows=37779 width=4)
Filter: has_email
Два частичных индекса может исключить последующее сканирование в зависимости от вашего распределения данных:
-- if many contacts have bad emails or are unsubscribed:
CREATE INDEX contacts_valid_email_idx ON contacts (id)
WHERE (NOT email_bad AND NOT email_unsub);
-- if many contacts have no email:
CREATE INDEX plain_contacts_valid_email_idx ON plain_contacts (id)
WHERE (has_email);
Возможно, вам не хватает индекса по внешнему ключу:
CREATE INDEX plain_contacts_contact_id_idx ON plain_contacts (contact_id);
И последнее, но не менее важное: если вы никогда не анализировали свои данные, вам нужно выполнить:
VACUUM ANALYZE;
Если после того, как все это будет сделано, это все еще будет происходить медленно, вы не сможете ничего сделать, если не объединить свои таблицы plain_contacts и таблицы контактов: получение вышеуказанного плана запросов, несмотря на вышеприведенные индексы, означает, что большинство / все ваши подписчики подписался на этот конкретный список - в этом случае приведенный выше план запроса будет самым быстрым.