Как рассчитать отклонение наблюдения от всех наблюдений? - PullRequest
0 голосов
/ 31 октября 2019

Не знаю, как рассчитать отклонение 1 образца от остальных. Например, у нас есть 5 наблюдений A: 5, 5, 5, 5, 5. и 5 других наблюдений B: 1, 2, 3, 4, 5. Мы добавляем к обоим наблюдениям еще одно число - «4». Мы хотим вычислить отклонение 4 от набора данных A и набора данных B.

Я пытался использовать:

dataset A:
4 is the 1st order in dataset A. Length of dataset A + '4' = 6. 
1 / 6 = 16.6% - is the place of '4'
dataset B:
4 is the 4.5 order (between 4 and 5) in dataset B. 
Length of dataset B + '4' = 6. 4,5 / 6 = 75% - is the place of '4' 

Но идентификатор не работает, если набор данных имеет только 1 выборку (1 /1 = 100, но ожидаемый - 50%, т. Е. - средний).

Другой метод:

dataset A:
4 / median(dataset) =  80% - deviation from median
4 / mean(dataset) =  83% - deviation from mean

dataset B:
4 / median(dataset) = 114% - deviation from median
4 / mean(dataset) = 126% - deviation from mean

, оба подхода выглядят неоднозначно. Я ожидаю, что вычисление 4 вернет процентиль места '4' в наборе данных (например, 50 означает, что 4 находится в середине, 100 - что 4 находится в верхнем крае).

Если мне нужнорассчитать процентиль по значению, как я могу это сделать?

...