У меня есть набор данных:
data data;
input group $ count;
datalines;
A 4
A 3
A 2
A 1
B 1
C 1
D 2
D 1
E 1
F 1
G 2
G 1
H 1
;
run;
Первая переменная является идентификатором группы, вторая подсчитывает количество наблюдений по группам, набор данных сортируется по группам, а затем по количеству в порядке убывания.
Я хочу новую переменную, которая принимает максимум переменной "count" для каждой группы, например:
data data;
input group $ count max_count;
datalines;
A 4 4
A 3 4
A 2 4
A 1 4
B 1 1
C 1 1
D 2 2
D 1 2
E 1 1
F 1 1
G 2 2
G 1 2
H 1 1
;
run;
Самое близкое, что мне удалось получить, это выполнить:
data data;
set data;
by group;
if first.group then max_count=count;
run;
Но результат:
data data;
input group $ count max_count;
datalines;
A 4 4
A 3 .
A 2 .
A 1 .
B 1 1
C 1 1
D 2 2
D 1 .
E 1 1
F 1 1
G 2 2
G 1 .
H 1 1
;
run;
Есть идеи, как это сделать, пожалуйста?