Как применить groupby в pandas для обработки специфичных для клиента c запросов с течением времени - PullRequest
1 голос
/ 09 марта 2020

У меня есть некоторые данные о транзакциях с течением времени, и я пытаюсь применить групповую операцию в Pandas, чтобы я мог установить sh средний потраченный доход, среднее количество транзакций по клиентам за год, но не могу работать как это сделать в Pandas.

Данные выглядят так:

CustomerID  Year Revenue
123         2018 2000
126         2019 157
123         2019 563
674         2018 320

Я пробовал различные групповые операции, такие как:

df.groupby(["CustomerID", "Year"]).median()

Но это просто возвращает массивный фрейм данных.

1 Ответ

0 голосов
/ 09 марта 2020

Я понимаю, что это должна быть вложенная группа. Например, чтобы узнать количество клиентов за год:

groupby (['CustomerID', 'Year']). Count (). Groupby ("Year"). Count ()

Я уверен, что есть более элегантный подход, ум.

...