Предположим, у меня есть эта матрица
set.seed(123)
x <- matrix(rnorm(410),205,2)
x[8,] <- c(0.13152348, -0.05235148) #similar to x[5,]
x[16,] <- c(1.21846582, 1.695452178) #similar to x[11,]
Значения очень похожи на строки, указанные выше, и в контексте целых данных они являются полудубликатами.Что я мог сделать, чтобы найти и удалить их?Мои исходные данные - это массив, который содержит много таких матриц, но положение полудубликатов одинаково во всех матрицах.
Я знаю agrep
, но, насколько я понимаю, функция работает с векторами.