Перебирайте сгруппированные строки, чтобы получить разные комбинации пар - PullRequest
0 голосов
/ 19 мая 2018

Имея следующую таблицу:

read.table(text = "route origin dest seq
    1   a b 1
    1   b c 2
    1   c d 3
    1   d e 4
    2   f g 1
    2   g h 2
    2   h i 3", header = TRUE)

Я пытаюсь найти способ прохождения каждой строки, сгруппированной по маршруту, и перебрать каждую потенциальную комбинацию исходных пар назначения, принимая во внимание последовательностьпеременная и маршрут, как упомянуто.

Результат должен выглядеть примерно так:

  origin   dest
    a       b 
    a       c 
    a       d 
    a       e 
    b       c
    b       d
  (...)   (...)

Идея, лежащая в основе этого, заключается в том, что поезд, например, маршрут 1, идет от a к e.Тем не менее, я хочу перечислить каждую возможность пар поездов с этим.Я пытался с igraph, но безуспешно.Есть идеи с dplyr или около того?

1 Ответ

0 голосов
/ 19 мая 2018

Надеюсь, это поможет!

library(dplyr)
library(tidyr)

df %>%
  mutate_if(is.factor, as.character) %>%    #convert factor variable to character
  group_by(route) %>%
  expand(origin = paste(origin, seq, sep = "_"), dest = paste(dest, seq, sep = "_")) %>%    #all possible combination of origin & destination grouped by route
  rowwise() %>%
  filter(strsplit(origin, split = "_")[[1]][1] != strsplit(dest, split = "_")[[1]][1] & 
           strsplit(origin, split = "_")[[1]][2] <= strsplit(dest, split = "_")[[1]][2]) %>%
  mutate(origin = gsub("_.*$", "", origin),
         dest   = gsub("_.*$", "", dest))

Вывод:

   route origin dest 
 1     1 a      b    
 2     1 a      c    
 3     1 a      d    
 4     1 a      e    
 5     1 b      c    
...

Пример данных:

df <- structure(list(route = c(1L, 1L, 1L, 1L, 2L, 2L, 2L), origin = structure(1:7, .Label = c("a", 
"b", "c", "d", "f", "g", "h"), class = "factor"), dest = structure(1:7, .Label = c("b", 
"c", "d", "e", "g", "h", "i"), class = "factor"), seq = c(1L, 
2L, 3L, 4L, 1L, 2L, 3L)), class = "data.frame", row.names = c(NA, 
-7L))

#  route origin dest seq
#1     1      a    b   1
#2     1      b    c   2
#3     1      c    d   3
#4     1      d    e   4
#5     2      f    g   1
#6     2      g    h   2
#7     2      h    i   3
...