Я работаю над составлением 20-летней климатологии, и у меня были проблемы с усреднением.Мои данные являются почасовыми с декабря 1999 года в формате CSV.Я использовал API, чтобы получить данные, и в настоящее время они находятся во фрейме данных Pandas.Я смог разделить часы, дни и т. Д. Следующим образом:
dfROVC1['Month'] = dfROVC1['time'].apply(lambda cell: int(cell[5:7]))
dfROVC1['Day'] = dfROVC1['time'].apply(lambda cell: int(cell[8:9]))
dfROVC1['Year'] = dfROVC1['time'].apply(lambda cell: int(cell[0:4]))
dfROVC1['Hour'] = dfROVC1['time'].apply(lambda cell: int(cell[11:13]))
Итак, я усреднил все дни, используя:
z=dfROVC1.groupby([dfROVC1.index.day,dfROVC1.index.month]).mean()
Это сработало, но я понял, что должен взятьсреднее количество минут и среднее значение максимумов всех моих данных.Мне было трудно понять все это.Я хочу, чтобы мой график выглядел так: Среднемесячное сечение , но я не могу понять, как заставить его работать.В настоящее время я использую Jupyter Notebook с Python 3. Буду признателен за любую помощь.