Не знаю, как рассчитать отклонение 1 образца от остальных. Например, у нас есть 5 наблюдений A: 5, 5, 5, 5, 5. и 5 других наблюдений B: 1, 2, 3, 4, 5. Мы добавляем к обоим наблюдениям еще одно число - «4». Мы хотим вычислить отклонение 4 от набора данных A и набора данных B.
Я пытался использовать:
dataset A:
4 is the 1st order in dataset A. Length of dataset A + '4' = 6.
1 / 6 = 16.6% - is the place of '4'
dataset B:
4 is the 4.5 order (between 4 and 5) in dataset B.
Length of dataset B + '4' = 6. 4,5 / 6 = 75% - is the place of '4'
Но идентификатор не работает, если набор данных имеет только 1 выборку (1 /1 = 100, но ожидаемый - 50%, т. Е. - средний).
Другой метод:
dataset A:
4 / median(dataset) = 80% - deviation from median
4 / mean(dataset) = 83% - deviation from mean
dataset B:
4 / median(dataset) = 114% - deviation from median
4 / mean(dataset) = 126% - deviation from mean
, оба подхода выглядят неоднозначно. Я ожидаю, что вычисление 4 вернет процентиль места '4' в наборе данных (например, 50 означает, что 4 находится в середине, 100 - что 4 находится в верхнем крае).
Если мне нужнорассчитать процентиль по значению, как я могу это сделать?