Я пытаюсь зафиксировать дату «посещения» == 2 »« пользователей »в новом столбце (« 2nd_visit_date »)
Вот код (включая новый столбец, который я хочу создать)
df=pd.DataFrame({'user':[1,1,2,2,2,3,3,3,3,3,4,4],
'date':['1995-09-01','1995-09-02','1995-10-03','1995-10-04','1995-10-05','1995-11-07','1995-11-08','1995-11-09','1995-11-10','1995-11-15','1995-12-18','1995-12-20'],
'visit_num':[1,2,1,2,3,1,2,3,4,5,1,2],
'2nd_visit_date':['1995-09-02','1995-09-02','1995-10-04','1995-10-04','1995-10-04','1995-11-08','1995-11-08','1995-11-08','1995-11-08','1995-11-08','1995-12-20','1995-12-20']})
Итак, я получаю:
user date visit_num 2nd_visit_date
1 1995-09-01 1 1995-09-02
1 1995-09-02 2 1995-09-02
2 1995-10-03 1 1995-10-04
2 1995-10-04 2 1995-10-04
2 1995-10-05 3 1995-10-04
3 1995-11-07 1 1995-11-08
3 1995-11-08 2 1995-11-08
3 1995-11-09 3 1995-11-08
3 1995-11-10 4 1995-11-08
3 1995-11-15 5 1995-11-08
4 1995-12-18 1 1995-12-20
4 1995-12-20 2 1995-12-20
Я пробовал следующий код, но он не работал:
df["2nd_visit_date"] = df.groupby("user")["date"].transform(df['visit_num']==2)
Любая помощь будет очень признателен , Спасибо.