Создание примера подмножества DF (код для части действительного в конце)
ANO_CENSO PK_COD_TURMA PK_COD_ENTIDADE MAIS_ENSINO_FUND MAIS_ENSINO_MED ENSINO_INTEG_FUND ENSINO_INTEG_MED
2011 27 12 1 0 0 1
2011 41 12 1 1 0 0
2011 18 13 0 0 0 1
2011 16 14 1 1 0 1
Я хочу объединить строки с одинаковым значением PK_COD_ENTIDADE в одини сохраните значения «1» для манекенов с тем же PK_COD_ENTIDADE. Меня не волнуют разные значения в PK_COD_TURMA, не имеет значения, кто останется в финальном DF (27 или 41). У моего DF есть несколько переменных, таких как PK_COD_TURMA, которые меня не интересуют для конечного значения, важными являются PK_COD_ENTIDADE и макеты со значением "1". В конце это выглядело бы так:
ANO_CENSO PK_COD_TURMA PK_COD_ENTIDADE MAIS_ENSINO_FUND MAIS_ENSINO_MED ENSINO_INTEG_FUND ENSINO_INTEG_MED
2011 27 12 1 1 0 1
2011 18 13 0 0 0 1
2011 16 14 1 1 0 1
Посмотрите, как у меня есть значения «1» для 2 манекенов в первом наблюдении PK_COD_ENTIDADE = 12 и еще одно значение «1» в другом манекене с PK_COD_ENTIDADE = 12, и в конце они слились в одно наблюдение для того же PK_COD_ENTIDADEдержа разные манекены "1" (и те же самые манекены с 1 для разных наблюдений не составляют 2, потому что они являются манекенами)
Я понятия не имею, как это сделать, я искал некоторые решения сdplyr, но не может применить что-либо близко к работе ...
Вот структура df со всеми переменными:
dftest2 <- structure(list(ANO_CENSO = c(2011, 2011, 2011, 2011), PK_COD_TURMA = c(27,
41, 18, 16), NU_DURACAO_TURMA = c(250, 255, 255,
255), FK_COD_ETAPA_ENSINO = c(41, 19, 19, 19), PK_COD_ENTIDADE = c(12,
12, 13, 14), FK_COD_ESTADO = c(11, 11, 11,
11), SIGLA = c("RO", "RO", "RO", "RO"), FK_COD_MUNICIPIO = c(1100023,
1100023, 1100023, 1100023), ID_LOCALIZACAO = c(1, 1, 1, 1), ID_DEPENDENCIA_ADM = c(2,
2, 2, 2), MAIS_ENSINO_FUND = c(1, 1, 0, 1), MAIS_ENSINO_MED = c(0,
1, 0, 1), ENSINO_INTEG_FUND = c(0L, 0L, 0L, 0L), ENSINO_INTEG_MED = c(1L,
0L, 1L, 1L)), row.names = c(NA, -4L), class = c("tbl_df", "tbl",
"data.frame"))