Выбор данных только в том случае, если квантиль 25% выше заданного значения - PullRequest
0 голосов
/ 24 сентября 2018

У меня есть DataFrame, и я хотел бы получить все данные только в том случае, если процентиль превышает заданное значение на 25%.

df['RaceRank'].describe()

count    5353.000000
mean      232.257713
std       347.250031
min         1.450000
25%        36.820000
50%        76.500000
75%       271.790000
max      1178.000000
Name: RaceRank, dtype: float64

Я пробовал следующий подход, но у меня не получилось:

d = df[df['RaceRank'].quantile(.25)>30]

И я не верю в следующее:

d = df[df['RaceRank']>df['RaceRank'].quantile(.25)]

Большое спасибо

1 Ответ

0 голосов
/ 24 сентября 2018

IIUC, вы можете сделать что-то вроде

mask = df['RaceRank'].quantile(.25) > 30
ones = np.ones(len(df), dtype=bool)

df[mask & ones]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...