У меня есть данные X всех дней 2000-2005 годов в файле .CSV.
Я хочу получить среднее значение Х для одной и той же даты разных лет, то есть среднее значение Х от 01 января 2000 года, 01 января 2001 года, 01 января 2002 года, 01 января 2003 года, 01 января 2004 г. и 01 января 2005 г., затем 02 января 2000 г., 02 января 2001 г., 02 января 2002 г., 02 января 2003 г., 02 января 2004 г. и 02 января 2005 г. и т. Д. для всех дней.
Я использовал: dataframe.groupby('dateindex.dayofyear').mean()['X']
команду для той же цели, но, к сожалению, она дала неправильные средние значения с 29 февраля в високосные годы и с 1 марта в не високосные годы.
Пример с датами, значениями X и Средним значением (ожидаемый результат для данных примера):
Date X Mean(Expected Outcome)
01-01-2000 1 (1+4)/2=2.5
02-01-2000 2 3.5
03-01-2000 3 4.5
01-01-2001 4 2.5
02-01-2001 5 3.5
03-01-2001 6 4.5