У меня есть df с cols:
date Account invoice category sales
12-01-2019 123 123 exhaust 2200
13-01-2019 124 124 tyres 1300
15-01-2019 234 125 windscreen 4500
16-01-2019 123 134 gearbox 6000
Я сгруппировал по счетам и продажам
dfres = df.groupby(['Account'])({'sales': np.sum})
Я получил:
sales
account
123 8200
124 3300
Я хочутеперь извлекаем исходный df, отфильтрованный по моим сгруппированным данным, так что уменьшенный набор данных, но у меня теперь такое же количество строк, что и у оригинала, и, к примеру, сохраняется только верхние 5% продаж. Как я могу удалить ненужные учетные записи?
Я пытался:
index_list = res.index.tolist()
newdf = df[df.account.isin(index_list)]
Большое спасибо