для df
id=c(12,12,13,14,14,15,16,17,18,18)
reg = c('FR','FR','DE','US','US','TZ','MK','GR','ES','ES')
code1=c('F56','G76','G56','T78','G78','G76','G64','T65','G79','G56')
code2=c('G56','I89','J83','S46','D78','G56','H89','G56','W34','T89')
bin1= c(0,1,1,0,1,1,0,0,0,1)
bin2= c(1,0,1,0,0,1,1,1,0,0)
bin3= c(0,0,0,1,1,0,0,1,0,1)
df = data.frame(idnumber,reg,code1,code2, bin1, bin2, bin3)
выглядит как
id reg code1 code2 bin1 bin2 bin3
12 FR F56 G56 0 1 0
12 FR G76 I89 1 0 0
13 DE G56 J83 1 1 0
14 US T78 S46 0 0 1
14 US G78 D78 1 0 1
15 TZ G76 G56 1 1 0
16 MK G64 H89 0 1 0
17 GR T65 G56 0 1 1
18 ES G79 W34 0 0 0
18 ES G56 T89 1 0 1
Я пытаюсь подсчитать число, если встречаются комбинации двоичных переменных (bin1
, bin2
, bin3
) значения, агрегированные по уникальным idnumber
, что-то вроде:
bin1 bin2 bin3 count
1 1 0 3
1 0 1 2
0 1 0 1
0 1 0 1
любое предложение приветствуется! Приветствия