У меня есть фрейм данных с большим количеством наблюдений без идентификатора, но есть 3 столбца, которые, по моему мнению, определяют каждое наблюдение / строку (именно в этом смысле я говорю, что эти столбцы являются суперключами, используя терминологиюбаз данных).Как я могу это проверить?
Я знаю, что только для одного столбца я мог бы использовать функцию как дубликат и просматривать частоты, но как я могу управлять несколькими столбцами и искать объединенные дублированные строки?
Заранее спасибо!
Или вы можете использовать distinct из dplyr
distinct
dplyr
library(dplyr) #nrow(distinct(df, x, y, z))==nrow(df) distinct(df, x, y, z) x y z 1 1 1 1 2 2 4 5
data
df <- data.frame(x=c(1,2,1),y=c(1,4,1), z=c(1,5,1))