Стек Python Pandas по почтовому индексу и группировка по месяцам / годам - PullRequest
0 голосов
/ 03 декабря 2018

У меня большой фрейм данных с данными транзакций.Я пытаюсь использовать python для агрегирования данных, начиная с почтовых индексов, затем за год и месяц, и, наконец, за общее количество транзакций за этот месяц.

My Df:

  Date        VAR1   VAR2    ZipCode    Transactions
YYYY-MM-DD.    X.     Y.     12345.         1.      

Итак, первое, что я сделал, это преобразовал время в дату

 df['Date'] = pd.to_datetime(df['Date'])
 df.info()
 # Date datetime64[ns]

Затем я разделил данные на год-месяц и количество транзакций:

# grouping the data by year and month
per = df.Date.dt.to_period("M")  
g = df.groupby(per)
g.sum() # so now that this works, we need to break it up into zip codes

, что дает выводиз:

Date.       Transactions
YYYY-MM.        X
YYYY-MM.        Y

Мои вопросы: что мне не хватает, чтобы получить почтовые индексы впереди:

ZipCode.     Date.    Transactions
 123345.   YYYY-MM.     sum()

Любая и вся помощь очень ценится

1 Ответ

0 голосов
/ 03 декабря 2018

Я полагаю, вам нужно добавить столбец ZipCode в groupby, если нужно группировать по почтовым индексам и по месяцам:

per = df.Date.dt.to_period("M")
df1 = df.groupby(['ZipCode',per])['Transactions'].sum().reset_index() 
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...