Используя dplyr
и tidyr
, мы можем gather
данные в длинную форму, удалить числа из имен столбцов, spread
это в широкоформатный формат, group_by
date
и prod
значение и принять sum
из tot
значений в каждой группе.
library(dplyr)
library(tidyr)
df %>%
gather(key, value, -date, na.rm = TRUE) %>%
mutate(key = sub("(.*)\\d+", "\\1", key)) %>%
group_by(key) %>%
mutate(row = row_number()) %>%
spread(key, value) %>%
mutate_at(vars(sku, tot), as.numeric) %>%
group_by(date, prod) %>%
summarise(sku = sku[1L],
tot = sum(tot))
# date prod sku tot
# <fct> <chr> <dbl> <dbl>
#1 01/02/2019 a 100 300
#2 01/02/2019 b 101 50
#3 02/02/2019 a 100 50
#4 02/02/2019 b 101 150
#5 02/02/2019 c 102 150
Данные
df <- structure(list(date = structure(c(1L, 1L, 2L, 2L, 2L), .Label =
c("01/02/2019", "02/02/2019"), class = "factor"), sku1 = c(100, 100, 101, 101,
102), prod1 = structure(c(1L, 1L, 2L, 2L, 3L), .Label = c("a",
"b", "c"), class = "factor"), tot1 = c(100, 200, 100, 50, 50),
sku2 = c(NA, 101, NA, 102, NA), prod2 = structure(c(NA, 1L,
NA, 2L, NA), .Label = c("b", "c"), class = "factor"), tot2 = c(NA,
50, NA, 100, NA), sku3 = c(NA, NA, NA, 100, NA), prod3 =
structure(c(NA, NA, NA, 1L, NA), .Label = "a", class = "factor"), tot3 = c(NA,
NA, NA, 50, NA)), row.names = c(NA, -5L), class = "data.frame")