У меня есть несколько таблиц, и все столбцы "a" таблиц должны иметь одинаковые значения для анализа, который я провожу. Фактические таблицы очень большие, поэтому я буду использовать упрощенные (фиктивные) фреймы данных.
Допустим, у меня есть следующие данные:
A <- data.frame(a = c(3,4,5,6,7,8), b = c(4,5,6,7,8,9), c = c(5,6,7,8,9,10))
B <- data.frame(a = c(2,3,4,5,6,7), b = c(4,5,6,7,8,9), c = c(5,6,7,8,9,10))
C <- data.frame(a = c(1,2,3,4,5,6), b = c(4,5,6,7,8,9), c = c(5,6,7,8,9,10))
D <- data.frame(a = c(4,5,6,7,8,9), b = c(4,5,6,7,8,9), c = c(5,6,7,8,9,10))
Теперь каждый фрейм данных имеет неидентичные значения в столбце "в виде. Моя цель состоит в том, чтобы удалить все строки, которые содержат разные значения по сравнению со всеми другими таблицами.
Чтобы иметь одинаковые значения в столбце "a" для всех таблиц A, B и C, я мог бы используйте следующие операции:
A <- A[A$a %in% B$a,]
B <- B[B$a %in% A$a,]
C <- C[C$a %in% B$a,]
B <- B[B$a %in% C$a,]
A <- A[A$a %in% C$a,]
Это уже становится очень утомительным, как вы можете видеть. Что если я добавлю таблицу D или другие кадры данных в этом миксе? Это становится практически невозможным, поскольку каждая таблица содержит хотя бы одно уникальное значение.