Точная мощность для документов Elasticsearch - PullRequest
0 голосов
/ 08 января 2019

Я хочу знать об алгоритме (hyperloglog ++), который используетвашифальный поиск для уникальных подсчетов.

Может ли установка точного порога для определенного значения дать мне точный уникальный счет до этого порога, независимо от ограничений памяти?

Использует ли алгоритм линейный счетчик до порога точности и после этого переключается на счетчик гиперлогога?

1 Ответ

0 голосов
/ 11 января 2019

Да, он использует линейный счет в хэш-таблице до порога точности. Вы также можете видеть это в соответствующем коде .

Но также помните, что пороговое значение точности по умолчанию составляет 3000, и вы можете установить его максимум до 40000. Установка более высокого значения фактически ограничит его до 40 000. Так что нет точных результатов для более высоких мощностей.

...