Неточность в расчете квартилей - PullRequest
1 голос
/ 21 февраля 2020

Я пытаюсь вычислить квартили моей колонки. Однако любые виды функций, которые я использовал (до сих пор я пытался использовать numpy процентиль и pandas квантиль с интерполяцией ближайший, верхний, нижний, линейный), они всегда возвращали неточный квартиль. Я проверил это по этой ссылке здесь . Есть ли какая-нибудь функция, которая могла бы действительно возвращать точные квартили, или, возможно, лучше сделать нашу собственную функцию, чтобы точно ее подсчитать? Поскольку в другом ответе я видел, что кто-то создал свою собственную функцию для подсчета здесь

Это мой столбец, результат которого должен быть Q1,Q3 = 200,650, но то, что показывает Q1,Q3 = 200,500. Какую бы интерполяцию я ни использовал, результат всегда будет неточным.

cols = pd.DataFrame({'numbers':[100,300,200,400,500,6000,800,200,200]})

1 Ответ

3 голосов
/ 21 февраля 2020

После того, как мы уроним дубликат, если вы не уроните дубликат, значение будет отключено с помощью quantile

s=pd.DataFrame({'numbers':[100,300,200,400,500,6000,800,200,200]})
s.drop_duplicates().quantile([0.25,0.75])
Out[13]: 
      numbers
0.25    250.0
0.75    650.0
...