Из этого сообщения stackoverflow
The main trick behind this algorithm is that if you, observing a stream of random integers, see an integer which binary representation starts with some known prefix, there is a higher chance that the cardinality of the stream is 2^(size of the prefix).
Hyperloglog использует хеш для достижения случайности, но как доказать, что хеширование значения дает случайный вывод?Или, еще более строго, гарантирует ли хеш псевдослучайность, например, равномерный вывод?
Если хеш не гарантирует равномерного вывода, есть ли способ, которым мы можем использовать верхнюю границу и квантовать неоднородность хеш-функции?