Как искать список идентификаторов в хешированном списке идентификаторов - PullRequest
0 голосов
/ 25 мая 2018

У меня есть список из примерно 1 миллиона идентификаторов (идентификатор набора A).Подмножество этих идентификаторов постоянно перемещается в новое хранилище данных в наборе идентификаторов B, но перед сохранением в наборе B они хешируются (например, в SHA256).Иногда идентификатор из набора A сбрасывается, и, следовательно, каждые 30 дней мне нужно проверять, все ли действительные идентификаторы набора B все еще действительны и существуют в наборе A.

Проблема заключается в том, что я не могу просто взять набор B и проверить на соответствие SetA, поскольку Set B хэшируется.Я думаю, что проверка каждого идентификатора в наборе A с помощью набора B может быть неэффективной.

Какие могут быть эффективные способы решения этой проблемы?Я могу выбрать другой метод хеширования для набора B, если это поможет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...