Как найти корреляцию между временными событиями и данными временных рядов в python? - PullRequest
2 голосов
/ 12 февраля 2020

У меня есть два разных файла Excel. Один из них включает данные временных рядов (268943 строки времени происшествия), как показано ниже

Другой файл представляет собой значение 14 рабочих, измеряемое ежедневно с 8 до 17 и в течение 4 месяцев (все данные объединены в один файл)

Я пытаюсь понять корреляцию между временем и значениями аварии (ежечасно с 8 до 17 за один час и ежедневно с понедельника по пятницу и ежемесячно)

Какой статистический метод подходит (Нормализованная автоматическая или перекрестная корреляция ) и как я могу это сделать? Как правило, в вопросах анализ корреляции выполняется между двумя значениями на основе временных рядов, но я думаю, что это немного отличается. Кроме того, здесь времена разные.

Спасибо за ваше продвижение ..

1 Ответ

2 голосов
/ 19 марта 2020

Я думаю, что времена аварий и уровни кровяного сахара не поступают из одного и того же источника, и поэтому я думаю, что невозможно провести корреляцию между этими двумя отдельными наборами данных. Если вы хотите предположить, что уровни сахара в крови всех 14 работников отражают уровень данных о несчастных случаях на производстве, это другая история. Но что, если у тех, у кого были несчастные случаи, профиль уровня сахара в крови значительно отличается от остальных, и что если ваш крошечный набор данных из 14 рабочих не содержит таких примеров? Я думаю, что лучшее, что вы можете сделать, - это изобразить уровень сахара в крови в вашем наборе данных из 14 рабочих, а также аналогичным образом проанализировать набор данных об аварии отдельно и попытаться визуально увидеть, есть ли здесь какая-либо корреляция.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...