Как построить последовательность, основанную на вхождениях меток времени с Python? - PullRequest
0 голосов
/ 22 февраля 2019

Я работаю в основном с Python для базы данных с 17 000 000 записей для 2 800 000 уникальных идентификаторов.Каждый идентификатор представляет событие процесса доставки, и все экземпляры имеют: ID, EVENT, TIMESTAMP (Datetime).Есть событие, которое обычно, но не всегда, запускает последовательность, и есть несколько результатов, то есть доставлено, возвращено и т. Д.

Моя цель в этом состоит в том, чтобы найти наиболее распространенный путь, по которому идет каждый идентификатор, то естьпорядок событий, которые происходят и получают узкие места в процессе.

Есть ли какой-нибудь инструмент визуализации, который я могу использовать с Python, в который встроена эта структура?Как бы вы посоветовали мне подойти к этому вопросу?

Спасибо

1 Ответ

0 голосов
/ 22 февраля 2019

Это не ответ для Python, но, учитывая вопрос, я думаю, что есть лучший способ выполнить такой анализ.

Я не знаю, слышали ли вы когда-нибудь о Process Mining.Но я думаю, что это идеальная вещь для использования в вашем случае.По сути, процесс майнинга состоит из анализа потока процесса.Я работал с разными инструментами, некоторые из них:

  • Дискотека
  • ProM (с открытым исходным кодом)
  • Celonis

В основномвсе, что вам нужно сделать, это определить, что это за идентификатор (он у вас уже есть), затем выбрать столбцы, представляющие метку времени (у вас уже есть) и название события (у вас оно также есть).

Любой из этих инструментов сможет дать вам идеальный анализ вашего потока.Какой путь является наиболее распространенным, среднее время для каждого события и т. Д. Если вы добавите больше атрибутов, он может даже возвратить причину, по которой следуют тому или иному пути на основе этих атрибутов.

...