У меня есть два фрейма данных: первый содержит product_id и время цикла для многих заказов на этот продукт, а другой фрейм данных содержит стандартное время цикла для каждого продукта. Чего я хочу добиться, так это сравнить их стандартное время цикла с распределением фактического времени цикла. Более конкретно, для продукта A историческое время цикла равно:
cycletime_for_A <- rnorm(n = 100,mean = 5,sd = 2)
standard_ct_for_A <- 8
percentile_of_a <- ecdf(cycletime_for_A)
percentile_of_a(standard_ct_for_A)
, тогда я получаю результат 0,95, что означает, что для 95% вероятности фактическое время цикла меньше стандартного времени цикла.
Тем не менее, у меня есть тысячи различных продуктов с разным стандартным временем цикла. Как бы я смог выполнить то же самое с группами? Я стремлюсь к подходу, когда это возможно.
Минимальный примерный набор данных, как показано ниже:
product_cycle_time <- data.frame(
product_id = rep(c("A","B","C"),100),
cycle_time = round(runif(n = 300,min = 1,max = 100))
)
standard_cycle_time <- data.frame(
product_id=c("A","B","C"),
std_cycle_time=c(10,20,15)
)