У меня есть набор из примерно 1,1 миллиона уникальных идентификаторов, и мне нужно определить, какие из них не имеют соответствующей записи в базе данных моего приложения. Набор идентификаторов также поступает из базы данных, но не из одного. Я использую PHP и MySQL и у меня достаточно памяти - PHP работает на сервере с 15 ГБ ОЗУ, а MySQL работает на своем собственном сервере с 7,5 ГБ ОЗУ.
Обычно я просто загружаю все идентификаторы в одном запросе, а затем использую их с предложением IN запроса SELECT, чтобы выполнить сравнение в одном кадре.
До сих пор мои попытки привели к созданию сценариев, которые либо занимают невыносимо много времени, либо увеличивают процессор до 100%.
Какой лучший способ загрузить такой большой набор данных и провести это сравнение?