MySQL Query занимает слишком много времени, индексы не используются - PullRequest
0 голосов
/ 03 июня 2018

У меня есть две таблицы, одна с примерно 700 строками, а другая с чуть более 100 000 строками.

Мой запрос заключается в том, чтобы найти все строки в первой таблице, в которой адрес электронной почты не существует в2-я таблица.

SELECT a.* 
FROM `csv_import_temp` a FORCE INDEX FOR JOIN (`imp_email`)
LEFT JOIN `xlefz_mailer_Contacts` b FORCE INDEX FOR JOIN (`idx_contact_email`)
ON a.`contact_email` like b.`contact_email`
WHERE b.`contact_email` is null

В обеих таблицах есть индекс для contact_email.Объяснение запроса показывает, что используется только один из индексов, даже после того, как я добавил предложения FORCE INDEX.

id  | select_type  | table  | type   | possible_keys  | key                | key_len  | ref  | rows    | Extra                    | 
 1  | SIMPLE       | a      | ALL    | NULL           | NULL               | NULL     | NULL | 292     | 
 1  | SIMPLE       | b      | index  | NULL           | idx_contact_email  | 228      | NULL | 106149  | Using where; Using index

В настоящее время выполнение запроса занимает чуть более 6 секунд.

Как заставить запрос использовать оба индекса?

1-я таблица:

CREATE TABLE `csv_import_temp` (
 `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT 'Primary Key',
 `contact_lname` varchar(50) COLLATE utf8_unicode_ci NOT NULL DEFAULT '' COMMENT 'Last or Family name',
 `contact_email` varchar(75) COLLATE utf8_unicode_ci DEFAULT '' COMMENT 'Email Address',
 `contact_state` varchar(20) COLLATE utf8_unicode_ci DEFAULT '' COMMENT 'State or provence',
 `contact_country` varchar(25) CHARACTER SET utf8 DEFAULT 'USA' COMMENT 'Country Name or Code',
 `contact_oktoemail` enum('Yes','No') COLLATE utf8_unicode_ci DEFAULT 'Yes' COMMENT 'Yes if OK to send Email',
 `contact_oktofax` enum('Yes','No') COLLATE utf8_unicode_ci DEFAULT 'Yes' COMMENT 'Yes of Ok to send Fax',
 `contact_oktomail` enum('Yes','No') COLLATE utf8_unicode_ci DEFAULT 'Yes' COMMENT 'Yes of OK to send mail',
 `contact_status` enum('Ok','Unsub','Bounced','BouncedUpdated','isAOL') COLLATE utf8_unicode_ci DEFAULT 'Ok' COMMENT 'Ok - can contact via email, Unsub if unsubscribe request has been received. Bounced = Mail sent to email address bounced.',
 PRIMARY KEY (`id`),
 KEY `imp_email` (`contact_email`)
) ENGINE=MyISAM AUTO_INCREMENT=293 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci

2-я таблица:

CREATE TABLE `xlefz_mailer_Contacts` (
 `contact_id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT 'Primary Key',
 `contact_created` timestamp NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT 'Timestamp when record was created',
 `contact_modified` timestamp NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT 'Timestamp when record was last modified',
 `manual_update` tinyint(1) NOT NULL DEFAULT '0' COMMENT 'If 1, has been manually updated',
 `manual_updateDT` timestamp NULL DEFAULT NULL COMMENT 'Timestamp of last manual update',
 `contact_import_id` int(11) DEFAULT NULL,
 `contact_company` varchar(100) COLLATE utf8_unicode_ci NOT NULL DEFAULT '' COMMENT 'Company Name',
 `contact_title` varchar(20) CHARACTER SET utf8 DEFAULT NULL COMMENT 'Mr., Ms., Dr., etc.',
 `contact_fname` varchar(50) CHARACTER SET utf8 NOT NULL DEFAULT '' COMMENT 'First or given name',
 `contact_lname` varchar(50) COLLATE utf8_unicode_ci NOT NULL DEFAULT '' COMMENT 'Last or Family name',
 `contact_email` varchar(75) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT 'Email Address',
 `contact_email_name` varchar(50) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT 'The mart of an email address before the @',
 `contact_email_domain` varchar(50) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT 'The mart of an email address after the @',
 `contact_addr1` varchar(50) COLLATE utf8_unicode_ci DEFAULT '' COMMENT '1st line of mailing address',
 `contact_addr2` varchar(50) COLLATE utf8_unicode_ci DEFAULT '' COMMENT 'Apartment, suite, etc.',
 `contact_city` varchar(50) COLLATE utf8_unicode_ci DEFAULT '' COMMENT 'City',
 `contact_state` varchar(20) COLLATE utf8_unicode_ci DEFAULT '' COMMENT 'State or provence',
 `contact_zip` varchar(15) COLLATE utf8_unicode_ci DEFAULT '' COMMENT 'Postal code',
 `contact_country` varchar(25) CHARACTER SET utf8 DEFAULT NULL COMMENT 'Country Name or Code',
 `contact_phone` varchar(20) COLLATE utf8_unicode_ci DEFAULT '' COMMENT 'Voice Phone',
 `contact_fax` varchar(20) COLLATE utf8_unicode_ci DEFAULT '' COMMENT 'Fax Phone',
 `contact_oktoemail` enum('Yes','No') COLLATE utf8_unicode_ci DEFAULT 'Yes' COMMENT 'Yes if OK to send Email',
 `contact_oktofax` enum('Yes','No') COLLATE utf8_unicode_ci DEFAULT 'Yes' COMMENT 'Yes of Ok to send Fax',
 `contact_oktomail` enum('Yes','No') COLLATE utf8_unicode_ci DEFAULT 'Yes' COMMENT 'Yes of OK to send mail',
 `contact_notes` varchar(1000) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT 'Notes regarding contact.',
 `contact_status` enum('Ok','Unsub','Bounced','BouncedUpdated','isAOL') COLLATE utf8_unicode_ci DEFAULT 'Ok' COMMENT 'Ok - can contact via email, Unsub if unsubscribe request has been received. Bounced = Mail sent to email address bounced. BouncedUpdated - indicates that the contact has been copied and updated with a new email address',
 PRIMARY KEY (`contact_id`),
 KEY `idx_contact_email` (`contact_email`),
 KEY `idx_contact_city` (`contact_city`),
 KEY `idx_contact_country` (`contact_country`),
 KEY `idx_contact_oktoemail` (`contact_oktoemail`),
 KEY `idx_contact_oktofax` (`contact_oktofax`),
 KEY `idx_contact_oktomail` (`contact_oktomail`),
 KEY `contact_import_id` (`contact_import_id`),
 KEY `idx_contact_oktoemailstatus` (`contact_oktoemail`,`contact_status`),
 KEY `contact_email_name` (`contact_email_name`,`contact_email_domain`),
 KEY `idx_mailer_contacts_manualupdate` (`manual_update`),
 KEY `idx_mailer_contact_manualupdateDT` (`manual_updateDT`)
) ENGINE=MyISAM AUTO_INCREMENT=128829 DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci

1 Ответ

0 голосов
/ 03 июня 2018

Чтобы устранить некоторые неправильные представления в вопросе:

  1. В индексированном объединении с вложенными циклами индекс будет использоваться только для второй таблицы объединения.Следовательно, указание FORCE INDEX FOR JOIN в первой таблице не будет иметь никакого эффекта.
  2. Когда EXPLAIN говорит, что тип является «index», это не означает, что индекс используется для поиска соединений.«index» указывает на полное сканирование индекса.Индекс используется в этом случае, потому что он содержит все столбцы, необходимые для этой таблицы.Другими словами, это индекс покрытия .(«Использование индекса» в столбце «EXPLAIN» на самом деле означает «только использование индекса»)
  3. Когда условие соединения основано на LIKE , индекс использовать нельзя.Столбцы могут содержать подстановочные знаки, для которых было бы невозможно найти совпадения при поиске по индексу.
  4. Сравнения с использованием = не обязательно чувствительны к регистру.Это будет зависеть от используемой сортировки.В вашем случае оба задействованных столбца определены с учетом регистра без учета регистра (utf8_unicode_ci).Следовательно, сравнение будет без учета регистра.
  5. Использование MyISAM; -)

Чтобы подвести итог, вы должны использовать равенство для условия соединения, или вы можете переписать запросна следующий, ИМХО, более простой запрос:

SELECT * 
FROM csv_import_temp
WHERE contact_email NOT IN (
    SELECT contact_email FROM xlefz_mailer_Contacts);
...