HLL + Precision для Google BigQuery - PullRequest
1 голос
/ 24 мая 2019

Точность использования HLL.INIT(...) и HLL.MERGE(...) описана здесь:

https://cloud.google.com/bigquery/docs/reference/standard-sql/hll_functions

Однако мне интересно, существует ли когда-либо размер кардинальности, при которомHLL гарантированно будет точным.Например, если у меня есть 10 различных значений, и я «объединяю» их вместе в различных областях, будет ли это каждый раз на 100% точным, или это будет зависеть от диапазона ошибок HLL?Другими словами, существует ли гарантированная верхняя граница для каждого уровня HLL Precision, при которой гарантированная точность составляет 100%?Если да, то как это можно определить для каждого уровня точности?

...