Мои данные выглядят так:
df = pd.DataFrame({
'cat_1': ['A'] * 3 + ['B'] * 3,
'cat_2': ['x', 'y', 'z'] * 2,
'value': [1, 2, 3, 4, 5, 6]
})
Я хочу создать функцию, которая группирует (с переменным числом групп) и суммирует мои данные.Например, следующие функции достигают этой цели для одной и двух групп соответственно.
def grp_and_sum(data, grp_var, sum_var):
df = data.groupby([grp_var])[sum_var]\
.sum()
return(df)
def grp_and_sum_2(data, grp_var1, grp_var2, sum_var):
df = data.groupby([grp_var1, grp_var2])[sum_var]\
.sum()
return(df)
Эти функции более или менее идентичны, за исключением числа переменных «группирующих» переменных.Как мне обобщить первую функцию, чтобы принять произвольное количество группирующих переменных?Спасибо.