У меня есть следующий фрейм данных df
:
bucket_value is_new_bucket
dates
2019-03-07 0 1
2019-03-08 1 0
2019-03-09 2 0
2019-03-10 3 0
2019-03-11 4 0
2019-03-12 5 1
2019-03-13 6 0
2019-03-14 7 1
Я хочу применить определенную функцию (скажем, функцию среднего) к каждой bucket_value
группам данных, где столбец is_new_bucket
равен нулю, так что результирующий кадр данных будет выглядеть следующим образом:
mean_values
dates
2019-03-08 2.5
2019-03-13 6.0
Другими словами, применение функции к последовательным строкам, где is_new_bucket = 0
, которая принимает bucket_value
в качестве ввода.
Например, если я хочу применить функцию max, результирующий кадр данных будет выглядеть следующим образом:
max_values
dates
2019-03-11 4.0
2019-03-13 6.0