Как элегантно разделить массив строк в элементах списка по подстроке? - PullRequest
1 голос
/ 05 февраля 2020

Как я могу элегантно разделить массив строк в подгруппах, основываясь на их первом символе?

Пример данных:

c("1_autoa", "1_autob", "1_autoc","2_bier", "3_hundx", "3_hundy")

Желаемый результат:

[[1]]
[1] "1_autoa" "1_autob" "1_autoc"

[[2]]
[1] "2_bier"

[[3]]
[1] "3_hundx" "3_hundy"

list(
  c("1_autoa", "1_autob", "1_autoc"), c("2_bier"), c("3_hundx", "3_hundy"))

Что я пробовал: (Рабочий пример, но кажется неестественным Лонг)

library(dplyr)
library(purrr)
library(magrittr)
data <- data.frame(
  id = 1:6, 
  name = c("1_autoa", "1_autob", "1_autoc", "2_bier", "3_hundx", "3_hundy")
)
data$start <- substr(x = data$name, start = 1, stop = 1)
spread(data, start, name) %>% 
  apply(MARGIN = 2, list) %>% 
  lapply(FUN = function(x) x[[1]][!is.na(x[[1]])])

Ответы [ 2 ]

3 голосов
/ 05 февраля 2020

Просто

split(x, gsub('\\D+', '', x))

, где

x <- c("1_autoa", "1_autob", "1_autoc","2_bier", "3_hundx", "3_hundy")
1 голос
/ 05 февраля 2020
v <- c("1_autoa", "1_autob", "1_autoc","2_bier", "3_hundx", "3_hundy")    
sapply(1:3, function(i) v[which(sapply(v, function(x) grepl(as.character(i), x)))])
[[1]]
[1] "1_autoa" "1_autob" "1_autoc"

[[2]]
[1] "2_bier"

[[3]]
[1] "3_hundx" "3_hundy"
...