Поиск очень быстрого алгоритма поиска строки фиксированной длины в базе данных строки фиксированной длины - PullRequest
0 голосов
/ 30 октября 2018

Буду признателен за предложения по очень очень быстрому алгоритму, который определяет, НЕ присутствует ли 8-байтовая строка в базе данных строк, где каждая строка также имеет длину 8 байт. В базе данных есть пара сотен миллионов строк. В базе данных могут быть кластеры строк. Я думаю об использовании алгоритма Aho Corasick, но надеюсь, что там может быть более быстрый метод.

Большое спасибо за вашу помощь.

1 Ответ

0 голосов
/ 30 октября 2018

Мне все равно, какой алгоритм вы найдете, сканирование строк на сотни миллионов строк, как решение, обычно вызывает неодобрение. Тип выполняемой операции предназначен для решения с помощью индексов базы данных, поскольку вы можете сделать эти определения практически мгновенно. Поскольку вы сказали, что вы ищете совпадения (количество байтов) в базе данных, использование индексов должно очень хорошо вписываться.

...