Давайте предположим, что у меня есть такой фрейм данных:
import pandas as pd
df = pd.DataFrame({'col1':['A','A', 'A', 'B','B'], 'col2':[2, 4, 6, 3, 4]})
Я хочу сохранить от него только те строки, которые имеют значения в col2
, которые меньше, чем x-й квантиль значений для каждой из групп значений col1
в отдельности.
Например, для 60-го процентиля кадр данных должен выглядеть так:
col1 col2
0 A 2
1 A 4
2 B 3
Как я могу сделать это эффективно в pandas
?