В чем разница между S и k для эскизов Theta? Почему S существует? - PullRequest
0 голосов
/ 24 апреля 2019

Для библиотеки Yahoo DataSketches у меня возникли проблемы с пониманием разницы между параметром S для Theta Sketch и значением k для эскиза KMV [который является типом Theta Sketch].Соответствующая страница документации здесь .

Упоминается, что S - это число записей в наборе всех уникальных элементов хэшированного потока, меньших, чем тета.Но разве k, по определению, не равно этому фиксированному числу?

Это становится особенно запутанным, потому что в документации говорится:

В конечном счете, это будет размерS, | S |, который будет определять сохраненный размер эскиза, который отделяет № 2 выше от значения k.

Но как может произойти развязка, если S = k?

Для справки, k определяется здесь следующим образом.

Сохраняйте не более k значений в эскизе одновременно.

Спасибо, что нашли время, чтобы прочитать мой вопрос!

...