У меня есть набор данных, содержащий информацию о посещениях больницы за определенные годы. Одна из переменных содержит коды округов для округов, в которых были посещения, а другая переменная содержит год для каждого посещения. То, что я пытаюсь сделать, это подсчитать, сколько посещений больниц в отдельных округах происходило за год. У меня есть доступ к коду SAS, который делает это, и я пытаюсь как-то дублировать его в R.
Код SAS:
proc sql;
select ED_VISIT_YEAR, count(distinct COUNTY_CD) as Counties from dataset
group by ED_VISIT_YEAR;
quit; run;
Я пытался использовать агрегатные и уникальные функции вместе с суммой, но я всегда получаю ошибки.
Единственное, что мне нужно для работы, это:
Check <- as.matrix(unique(ED_a$COUNTY_CD,ED_a$ED_VISIT_YEAR))
, который дает такой результат:
V1
1 1
2 2
3 3
4 4
5 5
6 6
7 7
8 8
9 9
10 10
11 11
12 12
13 13
14 14
15 15
16 1185
я ищу что-то вроде этого:
ED_VISIT_YEAR Counties
2005 16
2006 16
2007 16
2008 16
Я все еще довольно новичок в R, и это поставило меня в тупик, поэтому любая помощь будет принята с благодарностью.