Я пытаюсь предварительно вычислить распределения нескольких случайных величин.В частности, эти случайные величины являются результатами функций, оцененных в местах генома, поэтому для каждого из них будет порядка 10 ^ 8 или 10 ^ 9 значений.Функции довольно плавные, поэтому я не думаю, что потерю много точности, оценивая только каждые 2/10/100-е?база или около того, но независимо от того будет большое количество образцов.Мой план состоит в том, чтобы предварительно вычислять квантильные таблицы (возможно, процентили) для каждой функции и ссылаться на них при выполнении моей основной программы, чтобы избежать необходимости вычислять статистику распределения при каждом запуске.
Но я действительно не понимаю, какЯ легко могу сделать это: хранить, сортировать и уменьшать массив из 10 ^ 9 чисел с плавающей точкой не реально, но я не могу придумать другой способ, который не потеряет информацию о распределении.Есть ли способ измерения квантилей распределения выборки, который не требует хранения всего этого в памяти?