Я рассчитываю рассчитать 1-й и 3-й квартиль небольшого набора данных, чтобы определить выбросы:
6000 13500 15000 15000 17948
Хотя расчет довольно прост в теории, Я обнаружил, что python использует другой подход, чем тот, который я хочу (и функция Excel Quartile.EX C использует). Разница в том, что python включает медиану в расчете квартиля. Таким образом, для 1-го квартиля python выводит 13500, для 3-го 15000. Что мне нужно, это 9750 и 16474. Я не нашел варианта, который позволил бы мне это сделать.
Я использовал несколько кодов, чтобы попытаться найти это решение, мой текущий код для 1-го квартиля q1 = df.NSOT.quantile(0.25, interpolation = 'midpoint')
.
df - фрейм данных, а NSOT - столбец с заданными значениями. .
Вкл. https://www.mathwords.com/o/outlier.htm - пример того, как рассчитать выбросы так, как я хочу, с требуемыми 1-м и 3-м квартилями.
Есть предложения?
Извините, если что-либо по этому вопросу не соответствует правилам. Я только что создал эту учетную запись, и мне нужно было быстро получить ответ: /