Пожалуйста, внимательно прочитайте этот вопрос, учитывая все аспекты, прежде чем отмечать его как дубликат.У меня также была стековая учетная запись, но, похоже, я забыл, по какому адресу электронной почты, таким образом, совершенно новый!
У меня есть df
с несколькими столбцами и миллионами (буквально) строк.Вот пример, чтобы я мог быть более конкретным в своем вопросе, не раскрывая конфиденциальных данных:
a b c d ... AAA BBB
--- --- --- --- ... hf4r 192
--- --- --- --- ... h23g 103
--- --- --- --- ... 9fyd 7
--- --- --- --- ... hf4r 121
--- --- --- --- ... hf4r 32
--- --- --- --- ... h23g 12
............... ............
Я хочу сохранить только те строки, значение BBB
которых больше или равно 80-му процентилю BBB
s для их конкретной AAA
;для всех AAA
.
Я работаю с пандами.Я пробовал in-line for
s и .query
s и просто обычные вызовы, но я, должно быть, делал что-то не так, потому что каждый раз моему компилятору не нравилось то или другое.Буду признателен за любые идеи.