Я провожу анализ изменений времени цикла для каждого из наших процессов, связанных с различными продуктами, которые мы производим. Наши данные SAP содержат записи журнала начала и окончания работника, и цель состоит в том, чтобы рассчитать время цикла с этой информацией.
Однако SAP экспортирует метки времени начала и окончания в одном столбце, и нет доступного справочного столбца с указанием того, что является временем начала и времени окончания. Это приводит в порядок данные, например, распространение невозможно.
Текущие данные
- 1,6 миллиона строк
- 150 Операции
- 10 тысяч заказов
. Небольшая выборка данных выглядит следующим образом.
Order <- rep(c(1059866,1059891),each = 4)
Operation <- rep(c(1510,1550),4)
Timestamp <- c("30-11-2016 07:33:30", "30-11-2016 07:33:42", "30-11-2016 16:00:13", "30-11-2016 16:00:18", "30-11-2016 07:35:21", "30-11-2016 07:35:43", "30-11-2016 16:00:43", "30-11-2016 16:00:39")
df_current <- cbind(Order, Operation, Timestamp)
Эта информация о начале и завершении требуется для каждого шага процесса («Операция»).
Логически самая ранняя временная метка - это запись в журнале начала, а самая последняя временная метка - это запись в журнале завершения.
Однако я не могу понять, как сказать R создать новый столбец, который правильно указывает, какая отметка времени начинается и заканчивается на основе отметки времени.
Требуемые данные
Order <- rep(c(1059866,1059891),each = 4)
Operation <- rep(c(1510,1550),4)
Timestamp <- c("30-11-2016 07:33:30", "30-11-2016 07:33:42", "30-11-2016 16:00:13", "30-11-2016 16:00:18", "30-11-2016 07:35:21", "30-11-2016 07:35:43", "30-11-2016 16:00:43", "30-11-2016 16:00:39")
Status <- c("Start" , "Finish", "Start" , "Finish", "Start" , "Finish", "Finish", "Start")
df_desired <- cbind(Order, Operation, Timestamp, Status)
Когда данные выглядят так, я могу легко привести в порядок данные.
Спасибо