Использование rep в sapply для растягивания вектора в соответствии с другим вектором - PullRequest
0 голосов
/ 15 октября 2018

Я хочу создать data.frame ребер.Проблемы возникают, когда множество ребер заканчиваются на одном узле.Края определены в векторах from и to.

# Data
vertices <- data.frame(id = 1:3, label = c("a", "b", "c"), stringsAsFactors = FALSE)
to <- c("a", "b", "c")
from1 <- c("c", "a", "b")
from2 <- c("c", "a", "a,b,c")

Что я пробовал:

# Attempt 1
create_edges_1 <- function(from, to) {
  to <- sapply(to, function(x){vertices$id[vertices$label == x]})
  from <- sapply(from, function(x){vertices$id[vertices$label == x]})
  data.frame(from = from, to = to, stringsAsFactors = FALSE)
}

Это работает, например, create_edges_1(from1, to), вывод:

  from to
c    3  1
a    1  2
b    2  3

Однако, например, from2 эта попытка не удалась.

Поэтому я попробовал следующее:

# Attempt 2
create_edges_2 <- function(from, to) {
  to <- sapply(unlist(sapply(strsplit(to, ","), function(x){vertices$id[vertices$label == x]})), function(x){rep(x, sapply(strsplit(from2, ","), length))})
  from <- unlist(sapply(strsplit(from2, ","), function(x){vertices$id[vertices$label == x]}))
  data.frame(from = from, to = to, stringsAsFactors = FALSE)
}

Идея заключалась в том, чтобы "растянуть" to для каждого узлагде более одного края заканчивается.Однако create_edges_2(from1, to) и create_edges_2(from2, to) оба выдают ошибку

Ошибка в rep (x, sapply (strsplit (from2, ","), length)): недопустимый аргумент "times"

Что я делаю неправильно в моих sapply выражениях?

Ожидаемый результат для create_edges_2(from2, to):

  from to
     3  1
     1  2
     1  3
     2  3
     3  3

Ответы [ 2 ]

0 голосов
/ 15 октября 2018

Вы можете использовать объединения или match для этого

f2 <- strsplit(from2, ',')

df <- data.frame(from = unlist(f2)
                 , to = rep(to, lengths(f2))
                 , stringsAsFactors = FALSE)

С match

library(tidyverse)

map_dfc(df, ~ with(vertices, id[match(.x, label)]))

# # A tibble: 5 x 2
#    from    to
#   <int> <int>
# 1     3     1
# 2     1     2
# 3     1     3
# 4     2     3
# 5     3     3

С объединениями

library(dplyr)

df %>% 
  inner_join(vertices, by = c(from = 'label')) %>% 
  inner_join(vertices, by = c(to = 'label')) %>% 
  select_at(vars(matches('.x|.y')))

#   id.x id.y
# 1    3    1
# 2    1    2
# 3    1    3
# 4    2    3
# 5    3    3
0 голосов
/ 15 октября 2018

Вот способ:

# Attempt 3
library(dplyr)
to <- sapply(to, function(x){vertices$id[vertices$label == x]})
from0 <- sapply(from2, function(x) strsplit(x, ",")) %>% unlist() %>% as.character()
lengths0 <- lapply(sapply(from2, function(x) strsplit(x, ",")), length) %>% unlist()

to0 <- c()
for( i in 1:length(lengths0)) to0 <- c(to0, rep(to[i], lengths0[i]))

from <- sapply(from0, function(x){vertices$id[vertices$label == x]})
edges <- data.frame(from = from, to = to0, stringsAsFactors = FALSE)
edges

Предоставление этого результата в соответствии с запросом:

  from to
1    3  1
2    1  2
3    1  3
4    2  3
5    3  3

Идея состоит в том, чтобы разделить from с разделителями запятых и сохранить размеркаждый элемент, чтобы «растянуть» каждый узел.Здесь сделано с for петлей

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...