Суммирование по категориальной переменной - PullRequest
2 голосов
/ 02 ноября 2009

У меня есть набор данных о продажах единиц комиксов по объему (например, Naruto v10), который мне нужно сократить до продаж по сериям (поэтому все объемные продажи единиц Наруто будут объединены в одно наблюдение). У меня есть переменная «серия», которая определяет серию каждого наблюдения. Эквивалентный код в Stata будет:

by series, sort:replace unitssales=sum(unitssales);
by series, sort:keep if _n==_N

Но я пытаюсь понять, как это сделать в R. Любая помощь будет высоко ценится! Заранее спасибо!

1 Ответ

2 голосов
/ 02 ноября 2009

Не зная, в каком формате находятся ваши данные, я могу только предложить вам посмотреть на функцию tapply. Из справки:

> n <- 17; fac <- factor(rep(1:3, length = n), levels = 1:5)
> tapply(1:n, fac, sum)
 1  2  3  4  5 
51 57 45 NA NA 
...