Я новичок с python. Я пытаюсь выполнить повторную выборку и агрегировать ежедневные данные, чтобы получить сумму и среднее значение для разных столбцов. Но обратите внимание, когда результат получается в виде суммы или когда среднее значение либо слишком велико, либо слишком мало.
`Пример:
# Read in CSV file
climate_df = pd.read_csv("perth_climate_9021.csv",
header = None,
skiprows = [0,],
engine = 'python',
names = ['station', 'datetime', 'daily_rain',
'daily_rain_source', 'max_temp',
'max_temp_source', 'min_temp',
'min_temp_source','evap_pan',
'evap_pan_source'],
usecols = ['datetime', 'daily_rain',
'max_temp', 'min_temp',
'evap_pan'] ,
parse_dates = ['datetime']
)
climate_df = climate_df.set_index(pd.DatetimeIndex(climate_df['datetime']))
climate_df.rename(columns={'datetime':'year_month'}, inplace=True)
# Resample to month start: same data, except index is month start instead of month end
# climate_df = climate_df.sort_index().resample("MS").apply(lambda ser: ser.iloc[-1,])
climate_df1 = climate_df.groupby([climate_df['year_month'].dt.year, climate_df['year_month'].dt.month]).agg({"daily_rain" :'sum',
"max_temp" :'mean',
"min_temp" :'mean',
"evap_pan" :'sum'})
Фрагмент файла csv введите здесь описание изображения