Это не ответ для Python, но, учитывая вопрос, я думаю, что есть лучший способ выполнить такой анализ.
Я не знаю, слышали ли вы когда-нибудь о Process Mining.Но я думаю, что это идеальная вещь для использования в вашем случае.По сути, процесс майнинга состоит из анализа потока процесса.Я работал с разными инструментами, некоторые из них:
- Дискотека
- ProM (с открытым исходным кодом)
- Celonis
В основномвсе, что вам нужно сделать, это определить, что это за идентификатор (он у вас уже есть), затем выбрать столбцы, представляющие метку времени (у вас уже есть) и название события (у вас оно также есть).
Любой из этих инструментов сможет дать вам идеальный анализ вашего потока.Какой путь является наиболее распространенным, среднее время для каждого события и т. Д. Если вы добавите больше атрибутов, он может даже возвратить причину, по которой следуют тому или иному пути на основе этих атрибутов.