df = pd.DataFrame({'Campaign ID':[48464,48464,48464,48464,26380,26380,22676,39529,39529,46029,46029,46029,17030,46724,46724,39379,39379,39379],
'Campaign stage':["Lost","Developing","Discussing","Starting","Discussing", "Starting","Developing", "Discussing","Starting","Developing", "Discussing","Starting","Developing", "Developing","Discussing","Lost", "Developing","Discussing"],
'Stage Number':[-1, 3, 2, 1, 2, 1, 3, 2, 1, 3, 2, 1, 3, 3, 2, -1, 3, 2],
'Campaign Date':["2/8/2019","1/9/2019","1/3/2019","3/3/2018","2/14/2019","12/5/2018","7/25/2018","6/8/2018","3/4/2018","12/8/2018","9/9/2018","5/31/2018","6/7/2018","3/27/2018","1/6/2018","2/15/2019","12/15/2018","9/4/2018"]})
pvt = pd.pivot_table(df,values=['Campaign stage'],index=['Campaign ID','Campaign stage','Stage Number','Campaign Date'],aggfunc='count')
pvt.sort_values(['Campaign ID','Campaign Date'],ascending=[True,False])
Привет, ребята, у меня есть приведенный выше фрейм данных, и я хотел бы рассчитать количество дней между этапом «начало» и «обсуждение» кампании для каждой кампании, а затем рассчитать среднее значение.
Из-за качества данных этапы кампании не соответствуют друг другу.Поэтому для кампаний, не имеющих двух этапов «начало» и «обсуждение», я хочу установить значение 0.
Я создал сводную таблицу данных и отсортировал по убыванию даты кампании.Но я не знаю, что делать дальше.
Заранее спасибо за помощь.