Вы, понятно, запутались. Эта документация ужасна. Мне пришлось вернуться к работе, основанной на ней (Хиндман Р.Дж .; Фан Ю. (ноябрь 1996 г.). «Образцы квантилей в статистических пакетах». Американский статистик 50 (4): 361–365. doi: 10.2307 / 2684934 ), чтобы получить понимание. Давайте начнем с первой проблемы.
, где 1 <= i <= 9, (jm) / n <= p <(j-m + 1) / n, x [j] - статистика j-го порядка, n - размер выборки, а m - постоянная, определяемая типом квантиля выборки. Здесь гамма зависит от дробной части g = np + m-j. </p>
Первая часть взята прямо из статьи, но авторы документации не указали, что j = int(pn+m)
. Это означает, что Q[i](p)
зависит только от двух статистик порядка, ближайших к доле p
пути (отсортированных) наблюдений. (Для тех, кто, как и я, незнаком с этим термином, «статистика порядка» серии наблюдений - это отсортированный ряд.)
Кроме того, последнее предложение просто неверно. Следует читать
Здесь гамма зависит от дробной части np + m, g = np + m-j
Что касается m
, это просто. m
зависит от того, какой из 9 алгоритмов был выбран. Так что, как Q[i]
является функцией квантиля, m
следует считать m[i]
. Для алгоритмов 1 и 2 m
равно 0, для 3 m
равно -1/2, а для остальных это в следующей части.
Для непрерывных выборочных типов квантилей (от 4 до 9) выборочные квантили можно получить путем линейной интерполяции между статистикой k-го порядка и p (k):
p (k) = (k - альфа) / (n - альфа - бета + 1), где α и β - постоянные, определяемые типом. Кроме того, m = альфа + р (1 - альфа - бета) и гамма = г.
Это действительно сбивает с толку. То, что в документации называется p(k)
, не совпадает с p
, как было раньше. p(k)
- это позиция . В статье авторы пишут это как p
k
, что помогает. Тем более что в выражении для m
p
- это оригинальное p
, а m = alpha + p * (1 - alpha - beta)
. Концептуально, для алгоритмов 4-9, точки (p
k
, x[k]
) интерполируются для получения решения (p
, Q[i](p)
). Каждый алгоритм отличается только алгоритмом для p
k
.
Что касается последнего бита, то R просто указывает, что использует S.
В оригинальной статье приведен список из 6 «желательных свойств для выборочного квантиля» и указывается предпочтение для # 8, которое удовлетворяет всем на 1. # 5 удовлетворяет всем из них, но им не нравится это в других основания (это более феноменологически, чем вытекает из принципов). # 2 - это то, что нестаты, вроде меня, считают квантилями, и то, что описано в википедии.
Кстати, в ответ на dreeves ответ , Mathematica делает вещи значительно иначе. Я думаю, что я понимаю отображение. В то время как Mathematica легче понять, (a) легче выстрелить себе в ногу с бессмысленными параметрами, и (b) он не может выполнить алгоритм R №2. (Вот страница Quantile Mathworld , в которой говорится, что Mathematica не может сделать # 2, но дает более простое обобщение всех других алгоритмов в терминах четырех параметров.)