У меня есть следующие два фрейма данных:
df1 = data_frame(x = c(1128.4, 1101.2), y = c(124.5, 325.2)
df2 = data_frame(x = c(1128.7, 1100.5, 1527.8, 1347.5), y = c(83.2, 124.2,
370.3, 325.5))
Я хотел бы найти строки в df1
, которые почти идентичны (разница 1% в любом направлении) со строками в df2
, очень эффективным способом, чтобы сделать это для сотни строк в df1
против гораздо большего df2
.
Ожидаемый результат будет, например, список:
L$x = c(1,2)
L$y = c(2,4)
для обозначения похожих строк в каждом столбце.
Если бы задачей было найти полностью идентичные строки, я бы, конечно, использовал left_join
, где меньший df1
был бы слева.
Есть ли эффективный способ сделать это? (В общем, я хотел бы добиться этого и для нескольких столбцов).