Для библиотеки Yahoo DataSketches у меня возникли проблемы с пониманием разницы между параметром S
для Theta Sketch и значением k
для эскиза KMV [который является типом Theta Sketch].Соответствующая страница документации здесь .
Упоминается, что S
- это число записей в наборе всех уникальных элементов хэшированного потока, меньших, чем тета.Но разве k
, по определению, не равно этому фиксированному числу?
Это становится особенно запутанным, потому что в документации говорится:
В конечном счете, это будет размерS
, | S
|, который будет определять сохраненный размер эскиза, который отделяет № 2 выше от значения k
.
Но как может произойти развязка, если S = k
?
Для справки, k
определяется здесь следующим образом.
Сохраняйте не более k
значений в эскизе одновременно.
Спасибо, что нашли время, чтобы прочитать мой вопрос!