У меня есть список из примерно 1 миллиона идентификаторов (идентификатор набора A).Подмножество этих идентификаторов постоянно перемещается в новое хранилище данных в наборе идентификаторов B, но перед сохранением в наборе B они хешируются (например, в SHA256).Иногда идентификатор из набора A сбрасывается, и, следовательно, каждые 30 дней мне нужно проверять, все ли действительные идентификаторы набора B все еще действительны и существуют в наборе A.
Проблема заключается в том, что я не могу просто взять набор B и проверить на соответствие SetA, поскольку Set B хэшируется.Я думаю, что проверка каждого идентификатора в наборе A с помощью набора B может быть неэффективной.
Какие могут быть эффективные способы решения этой проблемы?Я могу выбрать другой метод хеширования для набора B, если это поможет.