Я хочу сгруппировать по столбцу A
, а затем суммировать значения в столбце C
для различных значений в столбцах B
и C
.Возможно ли сделать это внутри предложения summarise
?Я знаю, что это возможно с функцией distinct()
перед агрегацией.Как насчет чего-то подобного: Данные:
df <- tibble(A = c(1,1,1,2,2), B = c('a','b','b','a','a'), C=c(5,10,10,15,15))
Моя попытка не работает:
df %>%
group_by(A) %>%
summarise(sumC=sum(distinct(B,C) %>% select(C)))
Требуемый выход:
A sumC
1 15
2 15