У меня есть набор данных со случаями и событиями, относящимися к этим случаям.Я хочу вычесть первое время даты первого события из каждого из событий в этом случае, чтобы получить время, прошедшее с начала случая.
Я делаю:
grouped = data.groupby("case_id")
data["T_elapsed"] = grouped["event_id"].transform(lambda x: x-x.iloc[0])
Это работает,но это ужасно медленно для большого набора данных.Существуют ли менее дорогостоящие альтернативы для этого?
Заранее спасибо!