Как рассчитать ежемесячное среднее / стандартное значение для нескольких SKU во временном ряду Python - PullRequest
0 голосов
/ 09 июля 2020

У меня есть подробные данные истории продаж (несколько продаж каждый день), и я хочу рассчитать среднемесячное значение и стандартное отклонение. Данные выглядят примерно так:

Date, SKU, SalesQty
1/1/2019, A1, 10
1/2/2019, A1, 20
1/3/2019, B2, 30
1/4/2019, A1, 40
5/6/2019, A1, 100
5/20/2019, A1, 200
7/6/2019, B2, 120
7/23/2019, A1, 130
11/15/2019, B2, 150

Я планировал суммировать объем продаж каждого продукта за каждый месяц. Я думал, что могу использовать df.groupby('SKU').resample('M').sum(), но столкнулся с двумя проблемами.

Во-первых, когда я использую groupby ('SKU'). Resample ('M'), он меняет мой DatetimeIndex на MultiIndex с указанием месяца и SKU, поэтому я не могу провести повторную выборку для расчета среднемесячного среднего и стандартного отклонения.

Во-вторых, некоторые продукты не продаются в декабре, поэтому я не получаю данные за 12 месяцев по каждому продукту - каждому продукту суммируется только до последнего месяца, в котором были продажи. См. Ниже: Последняя продажа продукта A1 состоялась в июле, а продукт B2 - в ноябре, но мне нужны данные за 12 месяцев, чтобы получить точный расчет среднего и стандартного отклонения. Спасибо!

введите описание изображения здесь

...