Рассмотрим этот набор данных о погоде (данные о погоде за 50 лет с интервалом в 3 часа):
YEAR M D H WSP HS
1957-09-01 06:00:00 1957 9 1 6 8.9 0.9
1957-09-01 09:00:00 1957 9 1 9 6.4 0.6
1957-09-01 12:00:00 1957 9 1 12 5.2 0.4
1957-09-01 15:00:00 1957 9 1 15 1.9 0.3
1957-09-01 18:00:00 1957 9 1 18 3.7 0.3
1957-09-01 21:00:00 1957 9 1 21 3.9 0.4
1957-09-02 00:00:00 1957 9 2 0 5.6 0.4
1957-09-02 03:00:00 1957 9 2 3 5.3 0.5
Мне нужно пересчитать набор данных в 48-часовые периоды и получить максимальное значение HS для этого интервала. Затем это значение должно быть сгруппировано по месяцам, чтобы получить среднее значение за 50-летний период для каждого месяца.
Однако повторная выборка часто может включать диапазон значений за два месяца:
1957-09-04 12:00:00 1957 9 4 12 7.8 1.1
1957-09-04 15:00:00 1957 9 4 15 6.7 1.1
1957-09-04 18:00:00 1957 9 4 18 9.4 1.1
1957-09-04 21:00:00 1957 9 4 21 9.7 1.2
1957-09-05 00:00:00 1957 9 5 0 8.9 1.2
1957-09-05 03:00:00 1957 9 5 3 9.0 1.1
Мне нужно, чтобы повторная выборка была ограничена ТОЛЬКО месяцем, чтобы среднее значение за месяц по всему набору данных не искажалось данными других месяцев.