Определение шаблона в данных о продажах с помощью R - PullRequest
0 голосов
/ 23 мая 2018
PRODUCT_DESCRIPTION INCENTIVE_DATE  Sale_Count
Cons DDA Revers 4/24/2018   145
HEP HEIL Sd New 4/25/2018   2
WPB Per Sel Tra 5/2/2018    11
Bus Checking 27 5/18/2018   233
VWP MM Growth 9 5/1/2018    562
Cons Sav Revers 5/18/2018   4
HELOC APP   5/2/2018    289
Referred Inv Re 4/27/2018   235
Non-Profit 180  5/2/2018    34

Я создаю инструмент, чтобы определить, правильно ли размещались какие-либо продукты за день.Поэтому я собираю данные о ежедневных продажах и вижу, какие продукты отображаются как 0. Однако некоторые продукты являются циклическими и, например, только после четверга.Я выставляю 30 дней продаж.Я хочу пометить продукты, которые сегодня отсутствуют, в среднем ежемесячно превышают 10 продаж в день и которые не имеют регулярных интервалов 0.Пока мой код выглядит так:

csv <- read.csv('result_branch.csv')
csv$INCENTIVE_DATE <- as.character(csv$INCENTIVE_DATE)
csv$COST_CENTER <- as.character(csv$COST_CENTER)

csv <- spread(csv, INCENTIVE_DATE, Sale_Count)
csv[is.na(csv)] <- 0

branch <- csv$COST_CENTER
csv <- csv[, -1]


daily <- mutate(csv, prod_mean = rowMeans(csv))
daily$prod_mean <- round(daily$prod_mean, 2)



daily$Today_Missing <- daily[, 23] == 0
daily$Red_Flag <- (daily[, 25] == TRUE & daily[, 24] > 10) == TRUE
rownames(daily) <- branch



final <- final <- daily[order(-daily$Red_Flag, -daily$prod_mean), ]

Есть ли способ отфильтровать продукты, которые следуют обычному порядку отсутствия продаж в определенные дни?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...