Я хочу вычислить mean
(или любую другую сводную статистику длины один, например, min
, max
, length
, sum
) числовой переменной ("значение") в пределах каждого уровня переменная группировки («группа»).
Сводная статистика должна быть присвоена новой переменной, которая имеет такую же длину , что и исходные данные . То есть каждая строка исходных данных должна иметь значение, соответствующее текущему значению группы - набор данных должен , а не , быть свернутым до одной строки на группу. Например, рассмотрим группу mean
:
До
id group value
1 a 10
2 a 20
3 b 100
4 b 200
После
id group value grp.mean.values
1 a 10 15
2 a 20 15
3 b 100 150
4 b 200 150