У меня большой набор данных с 104 уникальными датами и 200k SKU.Для этого объяснения я использую 3 SKU и 4 даты.
Данные выглядят следующим образом:
Date SKU Demand Supply
20160501 1 10 10
20160508 1 35 20
20160501 2 20 15
20160508 2 15 20
20160522 2 5 0
20160522 3 55 45
Строки заполняются только при ненулевом спросе или предложении.Я хочу рассчитать совокупный спрос и предложение, имея непрерывный диапазон дат для всех идентификаторов, добавив 0 к отсутствующей дате.
Мой вывод будет выглядеть следующим образом:
Date SKU Demand Supply Cum_Demand Cum_Supply
20160501 1 10 10 10 10
20160508 1 35 20 45 30
20160515 1 0 0 45 30
20160522 1 0 0 45 30
20160501 2 20 15 20 15
20160508 2 15 20 35 35
20160515 2 0 0 35 35
20160522 2 5 0 40 35
20160501 3 0 0 0 0
20160508 3 0 0 0 0
20160515 3 0 0 0 0
20160522 3 55 45 55 45
Код для кадра данных
data = pd.DataFrame({'Date':[20160501,20160508,20160501,20160508,20160522,20160522],
'SKU':[1,1,2,2,2,3],
'Demand':[10,35,20,15,5,55],
'Supply':[10,20,15,20,0,45]}
,columns=['Date', 'SKU', 'Demand', 'Supply'])