У меня есть события со сложенным временем начала и окончания.Цель состоит в том, чтобы рассчитать общую продолжительность каждого события.Поворот для панд приводит к неверным результатам из-за перекрытия времени выполнения задач в каждом событии

например, продолжительность для событий должна составлять
event 1 10:16:08
event 2 9:07:48
event 3 6:08:46
Когда я использую pivot с пандами, я получаю неправильные результаты, по-видимому, из-за стекового характера задач событий
pd.pivot_table(df, values = 'Duration', index=['event'],aggfunc=np.sum).reset_index().sort_values('Duration').tail(10)
, пожалуйста, укажите мне правильное направление, как решить эту проблему.Я могу решить эту проблему, просматривая дату начала и окончания каждого события, но это будет длительным и ненужным
Итак, в качестве простого примера: 2 задачи в событии 1 (с 8:00 до 10:00 и 9:00).до 11 часов утра) должен давать результат 3 часа вместо 4 часов путем простого суммирования продолжительности