Предположим, у меня есть следующие data.frames
, которые формируют мой список:
df_1 = data.frame(x = c(1,2,2,5,6), y = c(20,20,21,24,55), z = rnorm(5))
df_2 = data.frame(x = c(1,2,2,5,6), y = c(20,20,21,24,55), z = rnorm(5))
df_3 = data.frame(x = c(3,3,5,6), y = c(20,20,21,24), z = rnorm(4))
df_4 = data.frame(x = c(1,2,2), y = c(20,20,21), z = rnorm(3))
df_5 = data.frame(x = c(2,2,5,6), y = c(19,20,21,40), z = rnorm(4))
df_6 = data.frame(x = c(1,5,6), y = c(20,20,24), z = rnorm(3))
df_7 = data.frame(x = c(1,5,6), y = c(20,20,24), z = rnorm(3))
df_8 = data.frame(x = c(1,5,6), y = c(20,20,24), z = rnorm(3))
df_lst = list(df_1, df_2, df_3, df_4, df_5, df_6, df_7, df_8)
Как видите, df_1
и df_2
имеют идентичные столбцы x
и y
, и то же самое относитсяна df_6
, df_7
и df_8
.
Как удалить дубликаты data.frames
на основе столбцов x
и y
?
Мне все равно, какиеdf
удаляется, то есть это может быть df_1
ИЛИ df_2
и df_6
И df_7
, ИЛИ df_6
И df_8
, ИЛИ df_7
И df_8
.
В моем реальном списке тысячи data.frames
.
Есть предложения?