У меня есть набор данных со столбцами Time.Interval, Net.Chg и Tick.Count. Net.Chg имеет положительный, отрицательный и ноль. Основываясь на Net.Chg, я хочу суммировать значения в Time.Count для положительного, отрицательного и нуля, а затем сгруппировать по дате
Time.Interval Net.Chg Tick.Count
2-Jan-17 NA NA
19:15 - 19:16 -0.0047 7
19:16 - 19:17 0 8
19:17 - 19:18 0.0025 10
3-Jan-17 NA NA
03:45 - 03:46 0 1
03:54 - 03:55 -0.0002 2
19:43 - 19:44 -0.0008 4
20:01 - 20:02 0.0025 2
4-Jan-17 NA NA
00:54 - 00:55 -0.0007 2
01:10 - 01:11 0.0005 1
01:11 - 01:12 0 1
Time.Interval <- c('2-Jan-17 _00:00:00.000000', '19:15 - 19:16', '19:16 - 19:17', '19:17 - 19:18', '3-Jan-17 _00:00:00.000000', '03:45 - 03:46', '03:54 - 03:55', '19:43 - 19:44', '20:01 - 20:02', '4-Jan-17 _00:00:00.000000', '00:54 - 00:55', '01:10 - 01:11', '01:11 - 01:12')
Net.Chg <- c(NA, -0.0047, 0, 0.0025, NA, 0, -0.0002, -0.0008, 0.0025, NA, -0.0007, 0.0005, 0)
Tick.Count <- c(NA, 7, 8, 10, NA, 1, 2, 4, 2, NA, 2, 1, 1)
data <- data.frame(Time.Interval, Net.Chg, Tick.Count)
Требуется вывод
pos = sum of "Tick.Count" if Net.Chg > 0
neg = sum of "Tick.Count" if Net.Chg < 0
UnChng = sum of "Tick.Count" if Net.Chg == 0
OF <- pos - Neg
Я попробовал следующий код
DF <- dd %>% group_by(grp = cumsum(str_detect(Time.Interval, "[A-Z]"))) %>% summarise(Time.Interval = anydate(first(Time.Interval)), pos = sum((Net.Chg > 0)* Tick.Count, na.rm = T), neg = sum((Net.Chg < 0) * Tick.Count, na.rm = T), unChg = sum(Net.Chg ==0 * Tick.Count, na.rm=T), OF = sum(sign(Net.Chg) * Tick.Count, na.rm = TRUE))
Этот код дает мне правильные значения для pos
, neg
и 'OF', но значение Unchng
неверно.
Токовый выход
Time.Interval pos Neg UnChng OF
02Jan2017 10 7 4 3
03Jan2017 2 6 5 -4
04Jan2017 1 2 4 -1
в то время как фактический результат должен быть
Time.Interval pos Neg UnChng OF
02Jan2017 10 7 8 3
03Jan2017 2 6 1 -4
04Jan2017 1 2 1 -1
Я попробовал sum(Net.Chg ==0 + Tick.Count, na.rm=T)
и length(Net.Chg ==0 * Tick.Count)
, но не смог.