Группировка с использованием двух разных функций синтаксиса - PullRequest
0 голосов
/ 08 января 2019

Я использую следующее утверждение, которое прекрасно работает для суммирования некоторых столбцов по группам и годам в проекте NBA Analytics.

nba_df =pd.DataFrame(bball_data.groupby(['Tm', 'Year'], as_index = False)['BPM_A', 'WORP', 'VORP', 'PER'].sum())

Я также хотел бы включить средний возраст, но не могу понять синтаксис.

Следующее утверждение будет работать само по себе, но возвращает только средний возраст, а не другие суммы:

nba_df =pd.DataFrame(bball_data.groupby(['Tm', 'Year'], as_index = False)['Age'].mean())

В принципе, мне нужен способ объединить 2.

1 Ответ

0 голосов
/ 08 января 2019

Вы можете использовать agg :

nba_df = pd.DataFrame(bball_data.groupby(['Tm', 'Year'], as_index=False).agg(
    {'BPM_A': 'sum', 'WORP': 'sum', 'VORP': 'sum', 'PER': 'sum', 'Age': 'mean'}))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...