У меня есть фрейм данных, который выглядит следующим образом (показаны 6 нижних записей):
Imax SzT
date
2017-09-14 10.139999 0.0
2017-09-15 0.000000 0.0
2017-09-16 0.000000 0.0
2017-09-17 0.000000 0.0
2017-09-18 0.200000 0.0
2017-09-19 12.710000 1.0
Этот кадр данных простирается до 1998 года и показывает дату, максимальную интенсивность дождевых осадков за эту дату (Imax) и то, произошло ли наводнение (SzT, 0 или 1).
Я хочу 1) разбить это на год, 2) посчитать частоту интенсивности осадков между различными интервалами (например, 0 - 2,5 мм / час, 2,5 - 5 мм / час и т. Д.), А затем 3) произвести подсчет количества событий наводнений, которые происходят (или нет) в эти интервалы. Мои мысли о результате выглядят примерно так:
2015
interval no flood flood
0 - 2.5 27 1
2.5 - 5 15 1
5 - 10 7 4
10 - 15 3 3
15 - 20 1 3
2016
interval no flood flood
0 - 2.5 24 0
2.5 - 5 17 0
5 - 10 6 2
10 - 15 6 1
15 - 20 3 2
2017
interval no flood flood
0 - 2.5 32 0
2.5 - 5 19 0
5 - 10 9 0
10 - 15 4 0
15 - 20 2 1
Моя конечная цель - рассчитать частую вероятность наводнения в данный год для данного интервала интенсивности осадков и показать, как оно меняется во времени.
Метод, о котором я до сих пор думал, чтобы разделить этот фрейм данных до сих пор, очень громоздкий, включающий добавление столбца для года «Y», маскирование df по значению «Y» для создания отдельных фреймов данных для каждого года, затем применяя дополнительные маски к каждой из этих dfs, чтобы определить частоту между каждым интервалом ... Пожалуйста, кто-нибудь, помогите!
Надеюсь, это имеет смысл, и большое спасибо заранее :))