Pandas groupby показывают только если количество наблюдений больше X - PullRequest
0 голосов
/ 04 сентября 2018

У меня есть следующий код, где я группирую прогноз столбца со средним значением достоверности столбца, а затем сортирую по наибольшему 10. Мне нужно иметь ограничение на количество наблюдений в каждой группе, поскольку некоторые из групп действительно маленький и поэтому не должен выходить сверху.

pretion_difficulty = master.groupby (['предсказание']) ['доверие']. Среднее (). Reset_index () pretion_difficulty.sort_values ​​(«достоверность», возрастание = ложь) [: 10]

1 Ответ

0 голосов
/ 04 сентября 2018

Я считаю, что нужно GroupBy.head:

prediction_difficulty.sort_values('confidence',ascending=False).groupby('prediction').head(10)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...