У меня есть следующие данные, отсортированные по ID
, затем Date
. Signal_Tag
равно 1 при наличии положительного сигнала.
ID Date Signal_Tag
1123 2020-01-03 0
1123 2020-01-03 1
1123 2020-06-09 1
1123 2020-06-10 1
2234 2019-01-01 0
2234 2019-01-01 0
2234 2019-01-01 1
2234 2019-01-01 1
2234 2019-01-02 1
2234 2019-01-02 1
2234 2019-01-02 0
Мне нравится создавать новую переменную Daily_Signal_Tag
, которая представляет первый дневной сигнал. Signal_Tag
может иметь более одного 1
в один и тот же день для одного и того же человека. Но Daily_Signal_Tag
может иметь только один 1
в один и тот же день для одного и того же человека.
Я понимаю, что в Pandas я могу сделать это за несколько шагов, то есть удалить дубликаты, агрегировать и повторно объединить, но я хотел бы сделать это, возможно, за один (или несколько) шагов, при этом имея возможность сгенерировать столбец Daily_Signal_Tag
. Желаемые выходные данные выглядят следующим образом:
ID Date Signal_Tag Daily_Signal_Tag
1123 2020-01-03 0 0
1123 2020-01-03 1 1
1123 2020-06-09 1 1
1123 2020-06-10 1 1
2234 2019-01-01 0 0
2234 2019-01-01 0 0
2234 2019-01-01 1 1
2234 2019-01-01 1 0
2234 2019-01-02 1 1
2234 2019-01-02 1 0
2234 2019-01-02 0 0