Я ищу генератор семейства хеш-функций, который может генерировать семейство хеш-функций с учетом набора параметров. Я не нашел такого генератора до сих пор.
Есть ли способ сделать это с пакетом hashlib
?
Например, я хотел бы сделать что-то вроде:
h1 = hash_function(1)
h2 = hash_function(2)
...
и h1
и h2
будут разными хеш-функциями.
Для тех из вас, кто может знать об этом, я пытаюсь реализовать алгоритм мини-хеширования для очень большого набора данных.
По сути, у меня есть очень большой набор функций (от 100 миллионов до 1 миллиарда) для данного документа, и мне нужно создать 1000-10000 различных случайных перестановок для этого набора функций.
Я НЕ хочу явно строить случайные перестановки, поэтому я хотел бы использовать следующую технику:
- сгенерируйте хеш-функцию
h
и учтите, что для двух индексов r
и s
r
появляется перед s
в перестановке, если h(r) < h(s)
, и делает это для 100-1000 различных хеш-функций.
Есть какие-нибудь известные библиотеки, которые я мог бы пропустить? Или какой-нибудь стандартный способ генерации семейств хеш-функций с помощью Python, о котором вы могли знать?