Что такое официальное правило "Сводка пяти чисел" statisti c по обработке нечетного и четного количества наборов данных - PullRequest
0 голосов
/ 28 мая 2020

Я изучил эти и многие академические c и правила учебников, похоже, не имеют надлежащего или принятого правила по этому вопросу. Это проблема c, поскольку без стандартов каждый, кто использует другой метод, даст другой результат.

Итак, проблема в следующем ... при следующем четном количестве наборов данных ...

dsEven = [ 3, 4, 4, 5, 7, 9, 12, 15, 16, 17, 19, 22, 25, 26];

Мы можем получить первые 3 значения dsEven как

min: 3
median: 13.5 (ave of the middle numbers 12 and 15)
max: 26

Теперь, чтобы получить нижний и верхний квартили, вам нужно разделить данные. Поскольку количество данных четное, это проще, и почти все руководства имеют одно и то же правило. 1014 *

Итак, как и в первом наборе, мы можем получить первые 3 значения dsOdd как

min: 3
median: 15 (the 7th index or 8th number in the 15 length dataset)
max: 26

Теперь, получив квартиль, здесь происходит путаница. в каком-то состоянии вам нужно получить только левую половину и только правую (http://web.mnstate.edu/peil/MDEV102/U4/S36.pdf). некоторые утверждают, что включают среднее число (https://dnett.public.iastate.edu/S401/fivenumsum.pdf). это выглядит так ...

// People in group A believes the right way to solve it is this. (Note the value 15 is excluded)
// like so...[ 3, 4, 4, 5, 7, 9, 12], 15, [ 16, 17, 19, 22, 22, 25, 26] 
DSOdd1 = [ 3, 4, 4, 5, 7, 9, 12]
DSOdd2 = [ 16, 17, 19, 22, 22, 25, 26]
// thus the q1 and q3 will just be the median of each
q1: 5
q3: 22

// People in group B believes the right way to solve it is this. (Note the value 15 is included)
DSOdd1 = [ 3, 4, 4, 5, 7, 9, 12, 15]
DSOdd2 = [ 15, 16, 17, 19, 22, 22, 25, 26]
// thus the q1 and q3 will just be the median of each
q1: 6 (average of middle numbers 5 and 7)
q3: 20.5 (average of middle numbers 19 and 22)

Видите большую разницу в результате?

...