Быстро сгенерируйте декартово произведение матрицы - PullRequest
7 голосов
/ 15 сентября 2009

Допустим, у меня есть матрица x, которая содержит 10 строк и 2 столбца. Я хочу сгенерировать новую матрицу M, которая содержит каждую уникальную пару строк из x, то есть новую матрицу с 55 строками и 4 столбцами.

например.,

x <- matrix (nrow=10, ncol=2, 1:20)

M <- data.frame(matrix(ncol=4, nrow=55))
k <- 1
for (i in 1:nrow(x))
for (j in i:nrow(x))
{
    M[k,] <- unlist(cbind (x[i,], x[j,]))
    k <- k + 1
}

Итак, x - это:

      [,1] [,2]
 [1,]    1   11
 [2,]    2   12
 [3,]    3   13
 [4,]    4   14
 [5,]    5   15
 [6,]    6   16
 [7,]    7   17
 [8,]    8   18
 [9,]    9   19
[10,]   10   20

А затем M имеет 4 столбца, первые два - одна строка из x, а следующие 2 - еще одна строка из x:

> head(M,10)
   X1 X2 X3 X4
1   1 11  1 11
2   1 11  2 12
3   1 11  3 13
4   1 11  4 14
5   1 11  5 15
6   1 11  6 16
7   1 11  7 17
8   1 11  8 18
9   1 11  9 19
10  1 11 10 20

Есть ли более быстрый или простой (или оба) способ сделать это в R?

Ответы [ 5 ]

8 голосов
/ 15 сентября 2009

Функция expand.grid(), полезная для этого:

R> GG <- expand.grid(1:10,1:10)
R> GG <- GG[GG[,1]>=GG[,2],]     # trim it to your 55 pairs
R> dim(GG)
[1] 55  2
R> head(GG)
  Var1 Var2
1    1    1
2    2    1
3    3    1
4    4    1
5    5    1
6    6    1
R> 

Теперь у вас есть подмножества 'n * (n + 1) / 2', и вы можете просто проиндексировать исходную матрицу.

3 голосов
/ 15 сентября 2009

Я не совсем понимаю, что вы делаете, поэтому я просто выброшу что-то, что может или не может помочь.

Вот то, что я считаю декартовым произведением двух столбцов:

expand.grid(x[,1],x[,2])
2 голосов
/ 15 сентября 2009

Вы также можете попробовать пакет "отношения". Вот виньетка. Она должна работать так:

relation_table(x %><% x)
1 голос
/ 29 ноября 2018

Вдохновленный другими ответами, вот функция, реализующая декартово произведение двух матриц, в случае двух матриц - полное декартово произведение только для одного аргумента, пропуская один из каждой пары:

cartesian_prod <- function(M1, M2) {
if(missing(M2)) {  M2 <- M1
     ind  <- expand.grid(1:NROW(M1), 1:NROW(M2))
     ind <- ind[ind[,1] >= ind[,2],] } else {
                                          ind  <- expand.grid(1:NROW(M1), 1:NROW(M2))}
rbind(cbind(M1[ind[,1],], M2[ind[,2],]))

}

1 голос
/ 15 сентября 2009

Используя ответ Дирка:

idx <- expand.grid(1:nrow(x), 1:nrow(x))
idx<-idx[idx[,1] >= idx[,2],]
N <- cbind(x[idx[,2],], x[idx[,1],])

> all(M == N)
[1] TRUE

Спасибо всем!

...