Я хотел бы получить среднее значение между двумя датами, сгруппированными по магазинам.
На самом деле у меня есть первый xlsx с продажами по магазинам и датам
shop sell date
a 100 2000
a 122 2001
a 300 2002
b 55 2000
b 245 2001
b 1156 2002
И у меня есть еще один файл с датой начала и окончания для каждого магазина
shop start stop
a 2000 2002
a 2000 2001
b 2000 2000
И поэтому я хотел бы получить среднее значение продаж между каждой датой из 2-го файла.
I попробуйте что-то вроде этого, но у меня есть список Df, и он не очень оптимален для меня
dfend = []
for i in df2.values:
filt1 = df.shop == i[0]
filt2 = df.date >= i[1]
filt3 = df.date <= i[2]
dfgrouped = df.where(filt1 & filt2 & filt3).groupby('shop').agg(mean = ('sell','mean'), begin = ('date','min'), end = ('date', 'max'))
dfend.append(dfgrouped)
Кто-нибудь может мне помочь?
Большое спасибо