У меня есть DataFrame для хранения ежедневных данных, как показано ниже:
Date Product Number Description Revenue
2010-01-04 4219-057 Product A 39.299999
2010-01-04 4219-056 Product A 39.520000
2010-01-04 4219-100 Product B 39.520000
2010-01-04 4219-056 Product A 39.520000
2010-01-05 4219-059 Product A 39.520000
2010-01-05 4219-056 Product A 39.520000
2010-01-05 4219-056 Product B 39.520000
2010-02-08 4219-123 Product A 39.520000
2010-02-08 4219-345 Product A 39.520000
2010-02-08 4219-456 Product B 39.520000
2010-02-08 4219-567 Product C 39.520000
2010-02-08 4219-789 Product D 39.520000
(Номер продукта просто для того, чтобы дать представление)
То, что я собираюсь сделать, это объединить их с ежемесячными данными.
Что-то вроде:
Date Description Revenue
2010-01-01 Product A 157.85000 (Sum of all Product A in Month 01)
Product B 79.040000
Product C 00.000000
Product D 00.000000
2010-02-01 Product A 39.299999 (Sum of all Product A in Month 02)
Product B 39.520000
Product C 39.520000
Product D 39.520000
Проблема в том, что у меня 500+ продуктов на каждый месяц
Я новичок в python и не знаю, как это реализовать. В настоящее время я использую
import pandas as pd
import numpy as np
import matplotlib
%matplotlib inline
data.groupby(['DATE','REVENUE']).sum().unstack()
, но не группируйте его с продуктами.
Как я могу это реализовать?