алгоритм динамического мониторинга квантилей - PullRequest
4 голосов
/ 07 марта 2011

Я хочу оценить квантиль некоторых данных.Данные настолько огромны, что не помещаются в памяти.И новые данные продолжают поступать. Кто-нибудь знает алгоритм для мониторинга квантиля (ов) данных, наблюдаемых до сих пор с очень ограниченными памятью и вычислениями?Я считаю P2 алгоритм полезным.Но это не очень хорошо работает с моими данными, которые очень сильно распределены.

1 Ответ

0 голосов
/ 01 февраля 2013

посмотрите, как разделить пространство значений на ячейки, каждая ячейка содержит количество значений в диапазоне.

Вы можете попытаться уменьшить размер бункеров в той точке, где вы ожидаете найти искомый квантиль.

Если вы сделаете количество лотков достаточно большим, это должно работать достаточно хорошо.

...