Как хеширование потока значений гарантирует случайность в гиперлоглоге? - PullRequest
0 голосов
/ 20 февраля 2019

Из этого сообщения stackoverflow

The main trick behind this algorithm is that if you, observing a stream of random integers, see an integer which binary representation starts with some known prefix, there is a higher chance that the cardinality of the stream is 2^(size of the prefix).

Hyperloglog использует хеш для достижения случайности, но как доказать, что хеширование значения дает случайный вывод?Или, еще более строго, гарантирует ли хеш псевдослучайность, например, равномерный вывод?

Если хеш не гарантирует равномерного вывода, есть ли способ, которым мы можем использовать верхнюю границу и квантовать неоднородность хеш-функции?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...