Расчет и построение 20-летней климатологии - PullRequest
0 голосов
/ 19 декабря 2018

Я работаю над составлением 20-летней климатологии, и у меня были проблемы с усреднением.Мои данные являются почасовыми с декабря 1999 года в формате CSV.Я использовал API, чтобы получить данные, и в настоящее время они находятся во фрейме данных Pandas.Я смог разделить часы, дни и т. Д. Следующим образом:

dfROVC1['Month'] = dfROVC1['time'].apply(lambda cell: int(cell[5:7]))
dfROVC1['Day'] = dfROVC1['time'].apply(lambda cell: int(cell[8:9]))
dfROVC1['Year'] = dfROVC1['time'].apply(lambda cell: int(cell[0:4]))
dfROVC1['Hour'] = dfROVC1['time'].apply(lambda cell: int(cell[11:13]))

Итак, я усреднил все дни, используя:

z=dfROVC1.groupby([dfROVC1.index.day,dfROVC1.index.month]).mean()

Это сработало, но я понял, что должен взятьсреднее количество минут и среднее значение максимумов всех моих данных.Мне было трудно понять все это.Я хочу, чтобы мой график выглядел так: Среднемесячное сечение , но я не могу понять, как заставить его работать.В настоящее время я использую Jupyter Notebook с Python 3. Буду признателен за любую помощь.

1 Ответ

0 голосов
/ 19 декабря 2018

Существует ли причина, по которой вы не просто использовали дату и время для преобразования своего столбца времени?

Минимальные значения по месяцам:

z=dfROVC1.groupby(['Year','Month']).min()
...