Простое преобразование в Edgelist с R? - PullRequest
5 голосов
/ 24 марта 2012

Мне нужно сделать простое преобразование данных в R для использования с igraph.Мой фрейм данных имеет этот формат, сгруппированный по GROUP:

    A   GROUP
1   1       a
2   2       a
3   3       a
4   4       a
5   1       b
6   3       b
7   5       b

1.Как развернуть группы для получения неориентированного списка ребер el в этом формате?

    A   B
1   1   2
2   1   3
3   1   4
4   2   3
5   2   4
6   3   4
7   1   3
8   1   5
9   3   5

Примечание: нет собственных ссылок 1-1, 2-2, 3-3, ...

2.Как подсчитать вхождения AB и создать взвешенный крайний список из el?

    A   B   weight
1   1   2        1
2   1   3        2
3   1   4        1
4   2   3        1
5   2   4        1
6   3   4        1
7   1   5        1
8   3   5        1

Ответы [ 2 ]

3 голосов
/ 24 марта 2012

Вот решение, которое я прокомментировал в коде:

# your data
df <- data.frame(A = c(1, 2, 3, 4, 1, 3, 5),
             GROUP = c("a", "a", "a", "a", "b", "b", "b"))

# define a function returning the edges for a single group
group.edges <- function(x) {
  edges.matrix <- t(combn(x, 2))
  colnames(edges.matrix) <- c("A", "B")
  edges.df <- as.data.frame(edges.matrix)
  return(edges.df)
}

# apply the function above to each group and bind altogether
all.edges <- do.call(rbind, lapply(unstack(df), group.edges))

# add weights
all.edges$weight <- 1
all.edges <- aggregate(weight ~ A + B, all.edges, sum)
all.edges
#   A B weight
# 1 1 2      1
# 2 1 3      2
# 3 2 3      1
# 4 1 4      1
# 5 2 4      1
# 6 3 4      1
# 7 1 5      1
# 8 3 5      1
2 голосов
/ 24 марта 2012

Вот способ получить список ребер с помощью plyr:

foo <- data.frame(
  A = c(1,2,3,4,1,3,5),   
  GROUP = c("a","a","a","a","b","b","b"))

library("plyr")

E1 <- do.call(rbind,dlply(foo,.(GROUP),function(x)t(combn(x$A,2))))

E1

Возвращает:

      [,1] [,2]
 [1,]    1    2
 [2,]    1    3
 [3,]    1    4
 [4,]    2    3
 [5,]    2    4
 [6,]    3    4
 [7,]    1    3
 [8,]    1    5
 [9,]    3    5

Затем, чтобы получить веса (здесь я использую, что combn ставитсначала самый младший номер):

W <- apply(E1,1,function(x)sum(E1[,1]==x[1]&E1[,2]==x[2]))
E2 <- cbind(E1,weight=W)
E2 <- E2[!duplicated(E2),]

E2

Что возвращает:

         weight
[1,] 1 2      1
[2,] 1 3      2
[3,] 1 4      1
[4,] 2 3      1
[5,] 2 4      1
[6,] 3 4      1
[7,] 1 5      1
[8,] 3 5      1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...