Панды ... нужна ли функциям квантиля отсортированные данные для вычисления процентилей? - PullRequest
0 голосов
/ 27 сентября 2019

Я использую Pandas, чтобы очистить некоторые данные и сделать основную статистику.Мне интересно, если quantile() сортирует значения перед вычислением или я должен выполнить сортировку заранее?

Например, здесь я пытаюсь получить 50-й процентиль числа работников в каждой компании

Percentile50th = Y2015_df.groupby (["company"])["worker"].quantile(0.50)

Я спрашиваю, потому что, когда я проверял полученные значения с результатами в MS Excel, я обнаружил, что функция Медиана требует сортировки данных, чтобы получить правильную медиану.Но я не уверен, так ли это в Пандах.

1 Ответ

1 голос
/ 27 сентября 2019

Вам не нужно сортировать.Смотрите ссылку в моем предыдущем комментарии. Пример * +1003 *

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...