При удалении строк, которые являются дубликатами в двух конкретных столбцах, возможно ли предпочтительно сохранить одну из повторяющихся строк на основе третьего столбца?
Рассмотрим следующий пример:
# Example dataframe.
df <- data.frame(col.1 = c(1, 1, 1, 2, 2, 2, 3),
col.2 = c(1, 1, 1, 2, 2, 2, 2),
col.3 = c('b', 'c', 'a', 'b', 'a', 'b', 'c'))
# Output
col.1 col.2 col.3
1 1 b
1 1 c
1 1 a
2 2 b
2 2 a
2 2 b
3 2 c
Я хотел бы удалить строки, которые являются дубликатами как в col.1
, так и col.2
, при этом всегда сохраняя дублирующую строку, имеющую col.3 == 'a'
, в противном случае не имеет предпочтения для сохраняемой дублирующейся строки.В этом примере результирующий фрейм данных будет выглядеть так:
# Output.
col.1 col.2 col.3
1 1 a
2 2 a
3 2 c
Вся помощь приветствуется!