Question

У меня есть три или более независимых переменных, представленных в виде векторов R, например:

A <- c(1,2,3)
B <- factor(c('x','y'))
C <- c(0.1,0.5)

, и я хочу взять декартово произведение всех из них и поместить результат в кадр данных, например, так::

A B C
1 x 0.1
1 x 0.5
1 y 0.1
1 y 0.5
2 x 0.1
2 x 0.5
2 y 0.1
2 y 0.5
3 x 0.1
3 x 0.5
3 y 0.1
3 y 0.5

Я могу сделать это вручную, записывая вызовы на rep:

d <- data.frame(A = rep(A, times=length(B)*length(C)),
                B = rep(B, times=length(A), each=length(C)),
                C = rep(C, each=length(A)*length(B))

, но должен быть более элегантный способ сделать это, да?product in itertools выполняет часть работы, но я не могу найти способ поглотить вывод итератора и поместить его во фрейм данных.Любые предложения?

ps Следующий шаг в этом расчете выглядит как

d$D <- f(d$A, d$B, d$C)

, поэтому, если вы знаете способ выполнить оба шага одновременно, это также будет полезно.

Ramnath · Answer 1 · 30 ноября 2010

Вы можете использовать expand.grid(A, B, C)

РЕДАКТИРОВАТЬ: альтернативой использованию do.call для достижения второй части, является функция mdply.Вот код

d = expand.grid(x = A, y = B, z = C)
d = mdply(d, f)

, чтобы проиллюстрировать его использование с помощью тривиальной функции «вставить», вы можете попробовать

d = mdply(d, 'paste', sep = '+');

misssprite · Answer 2 · 24 января 2013

Есть функция, управляющая фреймом данных, которая в этом случае полезна.

Может производить различные объединения (в терминологии SQL), а декартово произведение - особый случай.

Сначала необходимо преобразовать переменные в фреймы данных, потому что в качестве параметров берется фрейм данных.

так что-то вроде этого будет делать:

A.B=merge(data.frame(A=A), data.frame(B=B),by=NULL);
A.B.C=merge(A.B, data.frame(C=C),by=NULL);

Единственное, о чем нужно заботиться, это то, что строки сортируются не так, как вы изображали. Вы можете сортировать их вручную по своему желанию.

merge(x, y, by = intersect(names(x), names(y)),
      by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all,
      sort = TRUE, suffixes = c(".x",".y"),
      incomparables = NULL, ...)

"Если by или оба by.x и by.y имеют длину 0 (нулевой вектор длины или NULL), результат r является декартовым произведением x и y"

см. Этот URL для деталей: http://stat.ethz.ch/R-manual/R-patched/library/base/html/merge.html

chris · Answer 3 · 01 июня 2014

Рассмотрите возможность использования замечательной библиотеки data.table для выразительности и скорости. Он обрабатывает множество сценариев использования plyr (реляционная группа по) вместе с преобразованием, подмножеством и реляционным объединением, используя довольно простой унифицированный синтаксис.

library(data.table)
d <- CJ(x=A, y=B, z=C)  # Cross join
d[, w:=f(x,y,z)]  # Mutates the data.table

или в одну строку

d <- CJ(x=A, y=B, z=C)[, w:=f(x,y,z)]

Joshua Ulrich · Answer 4 · 30 ноября 2010

Вот способ сделать и то и другое, используя предложение Рамната о expand.grid:

f <- function(x,y,z) paste(x,y,z,sep="+")
d <- expand.grid(x=A, y=B, z=C)
d$D <- do.call(f, d)

Обратите внимание, что do.call работает на d "как есть", потому что data.frame - это list. Но do.call ожидает, что имена столбцов d будут совпадать с именами аргументов f.

Moody_Mudskipper · Answer 5 · 05 июня 2018

С библиотекой tidyr можно использовать tidyr::crossing (порядок будет такой же, как в OP):

library(tidyr)
crossing(A,B,C)
# A tibble: 12 x 3
#        A B         C
#    <dbl> <fct> <dbl>
#  1     1 x       0.1
#  2     1 x       0.5
#  3     1 y       0.1
#  4     1 y       0.5
#  5     2 x       0.1
#  6     2 x       0.5
#  7     2 y       0.1
#  8     2 y       0.5
#  9     3 x       0.1
# 10     3 x       0.5
# 11     3 y       0.1
# 12     3 y       0.5

Следующим шагом будет использование tidyverse, особенно семейства purrr::pmap*

library(tidyverse)
crossing(A,B,C) %>% mutate(D = pmap_chr(.,paste,sep="_"))
# A tibble: 12 x 4
#        A B         C D      
#    <dbl> <fct> <dbl> <chr>  
#  1     1 x       0.1 1_1_0.1
#  2     1 x       0.5 1_1_0.5
#  3     1 y       0.1 1_2_0.1
#  4     1 y       0.5 1_2_0.5
#  5     2 x       0.1 2_1_0.1
#  6     2 x       0.5 2_1_0.5
#  7     2 y       0.1 2_2_0.1
#  8     2 y       0.5 2_2_0.5
#  9     3 x       0.1 3_1_0.1
# 10     3 x       0.5 3_1_0.5
# 11     3 y       0.1 3_2_0.1
# 12     3 y       0.5 3_2_0.5

OmG · Answer 6 · 12 июля 2019

Использование перекрестного соединения в sqldf:

library(sqldf)

A <- data.frame(c1 = c(1,2,3))
B <- data.frame(c2 = factor(c('x','y')))
C <- data.frame(c3 = c(0.1,0.5))

result <- sqldf('SELECT * FROM (A CROSS JOIN B) CROSS JOIN C')

DamonJW · Answer 7 · 30 ноября 2010

Я никогда не смогу вспомнить эту стандартную функцию expand.grid.Итак, вот другая версия.

crossproduct <- function(...,FUN='data.frame') {
  args <- list(...)
  n1 <- names(args)
  n2 <- sapply(match.call()[1+1:length(args)], as.character)
  nn <- if (is.null(n1)) n2 else ifelse(n1!='',n1,n2)
  dims <- sapply(args,length)
  dimtot <- prod(dims)
  reps <- rev(cumprod(c(1,rev(dims))))[-1]
  cols <- lapply(1:length(dims), function(j)
                 args[[j]][1+((1:dimtot-1) %/% reps[j]) %% dims[j]])
  names(cols) <- nn
  do.call(match.fun(FUN),cols)
}

A <- c(1,2,3)
B <- factor(c('x','y'))
C <- c(.1,.5)

crossproduct(A,B,C)

crossproduct(A,B,C, FUN=function(...) paste(...,sep='_'))

Рамка данных декартовых произведений

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Рамка данных декартовых произведений

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 7 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов