Как проверить, является ли набор столбцов суперключем фрейма данных в R? - PullRequest
0 голосов
/ 13 июня 2018

У меня есть фрейм данных с большим количеством наблюдений без идентификатора, но есть 3 столбца, которые, по моему мнению, определяют каждое наблюдение / строку (именно в этом смысле я говорю, что эти столбцы являются суперключами, используя терминологиюбаз данных).Как я могу это проверить?

Я знаю, что только для одного столбца я мог бы использовать функцию как дубликат и просматривать частоты, но как я могу управлять несколькими столбцами и искать объединенные дублированные строки?

Заранее спасибо!

1 Ответ

0 голосов
/ 13 июня 2018

Или вы можете использовать distinct из dplyr

library(dplyr)
#nrow(distinct(df, x, y, z))==nrow(df)

distinct(df, x, y, z)
  x y z
1 1 1 1
2 2 4 5  

data

df <- data.frame(x=c(1,2,1),y=c(1,4,1), z=c(1,5,1))
...