В настоящее время у меня есть данные за период с 2018-01-01 по 2019-06-30, и мне нужно провести сравнение между 2018 и 2019 годами (данные суммируются).
Как такие, мне нужно удалить из моего набора данных с 2018-07-01 по 2018-12-12, так как я должен использовать данные только за год, если они существуют в предыдущем году.
Я почти могу получить то, что Я хочу с кодом ниже, за исключением того, что получает мне весь 2018 год, что нежелательно.
df.groupby(df.TimeStamp.dt.year).agg(sum)
У вас есть какие-либо предложения по этому поводу?