Панды группового с суммой и уникальными значениями - PullRequest
0 голосов
/ 04 июля 2018

у меня есть следующий фрейм данных

amount = pd.Series(np.random.randn(10),name='amount')
df = pd.DataFrame({'amount': amount,'price':50})
df['month'] = ['jan','feb','mar','apr','apr','apr','may','may','jun','jun']
df.set_index('month')

Я бы хотел сгруппировать по месяцам, суммировать столбцы суммы и отображать цену рядом с каждым месяцем. мы можем предположить, что цена будет одинаковой в течение каждого месяца, поэтому, например, использование функции mean () будет работать нормально.

Я не уверен, как объединить функции sum () и mean (), и попытка разделить на две функции, похоже, приведет к потере информации, например ::

df.groupby('month')[['amount']].sum()

1 Ответ

0 голосов
/ 19 июля 2018

Используйте функцию agg на groupby:

df.groupby('month').agg({
    'amount': sum,
    'price': 'mean'
})

Значит, вы можете использовать метод панд, заключив его в кавычки 'mean' или просто обозначая как np.mean

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...