Как использовать групповые и суммы - PullRequest
1 голос
/ 13 апреля 2020

Я работаю над фреймом данных, где мне нужно сгруппировать и суммировать. То, как я читаю, мне нужно сначала сгруппировать и выбрать столбцы, которые я хочу суммировать. Есть ли какая-либо разница между первым и последующим использованием столбца groupby и последующим выбором столбца, который я хочу суммировать, и выбором столбца, который я хочу суммировать, и последующим использованием groupby. результаты иногда.

1 Ответ

1 голос
/ 13 апреля 2020
grouped_df = df[['Transaction','Defects']].groupby('Manager').sum() 

приведет к ошибке, поскольку «Менеджер» не содержится во фрейме данных df [['Транзакция', 'Дефекты']].

Первая строка верна.

Лично я предпочитаю группирование по методу agg, вам стоит взглянуть на него. Вы можете использовать различные функции агрегирования. Пример:

grouped_df = df.groupby('Manager').agg({'Transaction': 'sum','Defects': 'mean'})
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...