Если вас интересует, какие строки дублируются для определенных столбцов, вы можете использовать подход plyr :
ddply(df, .(col1, col2), function(df) if(nrow(df) > 1) df else c())
Добавление переменной count с помощью dplyr :
df %>% add_count(col1, col2) %>% filter(n > 1) # data frame
df %>% add_count(col1, col2) %>% select(n) > 1 # logical vector
Для дублирующихся строк (с учетом всех столбцов):
df %>% group_by_all %>% add_tally %>% ungroup %>% filter(n > 1)
df %>% group_by_all %>% add_tally %>% ungroup %>% select(n) > 1
Преимущество этих подходов состоит в том, что вы можете указать, сколько дубликатов в качестве обрезки.