R: как контролировать поведение ребер в ggraph - PullRequest
0 голосов
/ 29 августа 2018

Я сталкиваюсь с этой проблемой: у меня есть такие данные:

library(tidyverse)
library(tidygraph)
library(ggraph)
library(ggrepel)

edges <- data.frame(a=c('k','k','k','k','k','z','z'),
                    b=c('b','b','b','b','c','b','c'), costant = 1)
  a b costant
1 k b       1
2 k b       1
3 k b       1
4 k b       1
5 k c       1
6 z b       1
7 z c       1

Теперь мне бы хотелось иметь граф с ggraph, в котором есть узлы и ребра с весами. Итак, я работал так:

# first I calculated the edges weights
edges1 <- edges%>% group_by(a,b) %>% summarise(weight = sum(costant))
> edges1
# A tibble: 4 x 3
# Groups:   a [?]
  a     b     weight
  <fct> <fct>  <dbl>
1 k     b          4
2 k     c          1
3 z     b          1
4 z     c          1

Тогда узлы:

nodes <- rbind(data.frame(word = edges$a, n = 1),data.frame(word = edges$b, n = 1)) %>%
 group_by(word) %>%
summarise(n = sum(n))
> nodes
# A tibble: 4 x 2
  word      n
  <fct> <dbl>
1 k         5
2 z         2
3 b         5
4 c         2

До сих пор все работает нормально. Теперь, следуя это как пример:

tidy <- tbl_graph(nodes = nodes, edges = edges1, directed = T)
tidy <- tidy %>% 
  activate(edges) %>% 
  arrange(desc(weight)
)

Внезапно я построил график:

ggraph(tidy, layout = "gem") + 
  geom_node_point(aes(size=n)) +
  geom_edge_link(aes(width = weight), alpha = 0.8) + 
  scale_edge_width(range = c(0.2, 2)) +
  geom_text_repel(aes(x = x, y=y , label=word)) 

Но результат таков:

enter image description here

И я не могу понять, почему существует линия между k и z, потому что этих ребер не существует.

Спасибо заранее.

1 Ответ

0 голосов
/ 29 августа 2018

Кажется, это связано с тем, что tbl_graph преобразует edge1 узлы тиббла из factor в integer на as.integer без учета тиббла nodes, это является источником ошибки. Если мы предварительно сконвертируем краевой узел в целые числа правильно, он будет работать как положено.

edges <- data.frame(a=c('k','k','k','k','k','z','z'),
                    b=c('b','b','b','b','c','b','c'), costant = 1)
edges1 <- edges%>% group_by(a,b) %>% summarise(weight = sum(costant))

nodes <- rbind(data.frame(word = edges$a, n = 1),data.frame(word = edges$b, n = 1)) %>%
  group_by(word) %>%
  summarise(n = sum(n))

edges2 <- edges1 # save edges with factor node labels into edge2
# convert 'from' and 'to' factor columns to integer columns correctly 
# with the nodes tibble's corresponding matched index values 
edges1$a <- match(edges1$a, nodes$word) 
edges1$b <- match(edges1$b, nodes$word)

tidy <- tbl_graph(nodes = nodes, edges = edges1, directed = T)
tidy <- tidy %>% 
  activate(edges) %>% 
  arrange(desc(weight)
  ) 

ggraph(tidy, layout = "gem") + 
   geom_node_point(aes(size=n)) +
   geom_edge_link(aes(width = weight), arrow = arrow(length = unit(4, 'mm')), end_cap = circle(3, 'mm'), alpha = 0.8) + 
   scale_edge_width(range = c(0.2, 2)) +
   geom_text_repel(aes(x = x, y=y , label=word)) 

edges2 # compare the edges in the following tibble with the next figure
# A tibble: 4 x 3
# Groups:   a [?]
    a     b     weight
  <fct> <fct>  <dbl>
#1 k     b       4
#2 k     c       1
#3 z     b       1
#4 z     c       1

enter image description here

...