Демонстрационные данные для легкой загрузки:
df <- structure(list(Assay = c(1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 3L), Genotype = structure(c(2L, 1L, 2L, NA, 3L, 2L, 3L, 3L, NA), .Label = c("A", "G", "T"), class = "factor"), Sample = c(1L, 2L, 3L, 1L, 1L, 2L, 2L, 4L, 1L), Result = c(0L, 1L, 0L, NA, 0L, 1L, 0L, 0L, NA)), .Names = c("Assay", "Genotype", "Sample", "Result"), class = "data.frame", row.names = c("1", "2", "3", "4", "5", "6", "7", "8", "9"))
Вы можете легко получить дублированные пары Assay / Sample с duplicated
:
vars <- c('Assay', 'Sample')
dup <- df[duplicated(x[, vars]), vars]
В результате:
> dup
Assay Sample
4 1 1
7 2 2
Для которого требуется простой merge
для требуемого результата:
> merge(dup, df)
Assay Sample Genotype Result
1 1 1 <NA> NA
2 1 1 G 0
3 2 2 G 1
4 2 2 T 0