Question

Я мог бы решить это, используя циклы, но я пытаюсь думать в векторах, чтобы мой код был более R-esque.

У меня есть список имен. Формат имя_фамилия. Я хочу вывести из этого списка отдельный список только с именами. Я не могу понять, как это сделать. Вот некоторые примеры данных:

t <- c("bob_smith","mary_jane","jose_chung","michael_marx","charlie_ivan")
tsplit <- strsplit(t,"_")

, который выглядит так:

> tsplit
[[1]]
[1] "bob"   "smith"

[[2]]
[1] "mary" "jane"

[[3]]
[1] "jose"  "chung"

[[4]]
[1] "michael" "marx"   

[[5]]
[1] "charlie" "ivan"

Я могу получить то, что хочу, используя такие циклы:

for (i in 1:length(tsplit)){
    if (i==1) {t_out <- tsplit[[i]][1]} else{t_out <- append(t_out, tsplit[[i]][1])} 
}

, который дал бы мне это:

t_out
[1] "bob"     "mary"    "jose"    "michael" "charlie"

Так, как я могу сделать это без петель?

hadley · Answer 1 · 31 августа 2009

И еще один подход:

t <- c("bob_smith","mary_jane","jose_chung","michael_marx","charlie_ivan")
pieces <- strsplit(t,"_")
sapply(pieces, "[", 1)

Словом, последняя строка извлекает первый элемент каждого компонента списка, а затем упрощает его до вектора.

Как это работает? Что ж, вам нужно реализовать альтернативный способ записи x[1] - "["(x, 1), то есть есть функция с именем [, которая выполняет поднаборы. Вызов sapply применяется вызывает эту функцию один раз для каждого элемента исходного списка, передавая два аргумента, элемент списка и 1.

Преимущество этого подхода перед другими заключается в том, что вы можете извлечь несколько элементов из списка без необходимости повторного вычисления разбиений. Например, фамилия будет sapply(pieces, "[", 2). Как только вы привыкнете к этому идиому, его довольно легко прочитать.

liebke · Answer 2 · 31 августа 2009

Вы можете использовать apply (или sapply)

t <- c("bob_smith","mary_jane","jose_chung","michael_marx","charlie_ivan")
f <- function(s) strsplit(s, "_")[[1]][1]
sapply(t, f)

bob_smith    mary_jane   jose_chung michael_marx charlie_ivan 

       "bob"       "mary"       "jose"    "michael"    "charlie"

См .: Краткое введение в «применить» в R

William Doane · Answer 3 · 31 августа 2009

Как насчет:

tlist <- c("bob_smith","mary_jane","jose_chung","michael_marx","charlie_ivan")
fnames <- gsub("(_.*)$", "", tlist)
# _.* matches the underscore followed by a string of characters
# the $ anchors the search at the end of the input string
# so, underscore followed by a string of characters followed by the end of the input string

для подхода RegEx?

Karsten · Answer 4 · 22 января 2010

а как же:

t <- c("bob_smith","mary_jane","jose_chung","michael_marx","charlie_ivan")

sub("_.*", "", t)

Matt Parker · Answer 5 · 31 августа 2009

Я сомневаюсь, что это самое элегантное решение, но оно превосходит циклы:

t.df <- data.frame(tsplit)
t.df[1, ]

Преобразование списков во фреймы данных - это единственный способ заставить их делать то, что я хочу. Я с нетерпением жду ответов людей, которые действительно понимают, как обращаться со списками.

Dirk Eddelbuettel · Answer 6 · 31 августа 2009

У тебя почти было это. Это действительно это просто вопрос

используя одну из *apply функций для циклического перебора существующего списка, я часто начинаю с lapply, а иногда переключаюсь на sapply
добавить анонимную функцию, которая одновременно работает с одним из элементов списка
вы уже знали, что это strsplit(string, splitterm) и что вам нужно нечетное [[1]][1], чтобы выбрать первое слагаемое ответа
просто сложите все вместе, начиная с предпочтительной переменной namne (поскольку мы остаемся в стороне от t или c и друзей)

что дает

> tlist <- c("bob_smith","mary_jane","jose_chung","michael_marx","charlie_ivan") 
> fnames <- sapply(tlist, function(x) strsplit(x, "_")[[1]][1]) 
> fnames 
  bob_smith    mary_jane   jose_chung michael_marx charlie_ivan   
      "bob"       "mary"       "jose"    "michael"    "charlie" 
>

brentonk · Answer 7 · 31 августа 2009

Вы можете использовать unlist():

> tsplit <- unlist(strsplit(t,"_"))
> tsplit
 [1] "bob"     "smith"   "mary"    "jane"    "jose"    "chung"   "michael"
 [8] "marx"    "charlie" "ivan"   
> t_out <- tsplit[seq(1, length(tsplit), by = 2)]
> t_out
[1] "bob"     "mary"    "jose"    "michael" "charlie"

Возможно, есть лучший способ извлечь только записи с нечетным индексом, но в любом случае у вас не будет цикла.

William Doane · Answer 8 · 31 августа 2009

И еще один подход, основанный на примере unlist Брентонка ...

tlist <- c("bob_smith","mary_jane","jose_chung","michael_marx","charlie_ivan")
tsplit <- unlist(strsplit(tlist,"_"))
fnames <- tsplit[seq(1:length(tsplit))%%2 == 1]

jmc200 · Answer 9 · 07 сентября 2012

Я бы использовал следующий метод на основе unlist ():

> t <- c("bob_smith","mary_jane","jose_chung","michael_marx","charlie_ivan")
> tsplit <- strsplit(t,"_")
> 
> x <- matrix(unlist(tsplit), 2)
> x[1,]
[1] "bob"     "mary"    "jose"    "michael" "charlie"

Большим преимуществом этого метода является то, что он одновременно решает эквивалентную проблему для фамилий:

> x[2,]
[1] "smith" "jane"  "chung" "marx"  "ivan"

Недостатком является то, что вам нужно быть уверенным, что все имена соответствуют структуре firstname_lastname; если нет, то этот метод сломается.

Virginie · Answer 10 · 28 февраля 2013

из исходного tsplit объекта списка, указанного в начале, эта команда будет делать:

unlist(lapply(tsplit,function(x) x[1]))

извлекает первый элемент из всех элементов списка, а затем преобразует список в вектор. Сначала можно распечатать список в матрице, затем извлечь первый столбец, но тогда вы зависите от того факта, что все элементы списка имеют одинаковую длину. Вот вывод:

> tsplit

[[1]]
[1] "bob"   "smith"

[[2]]
[1] "mary" "jane"

[[3]]
[1] "jose"  "chung"

[[4]]
[1] "michael" "marx"   

[[5]]
[1] "charlie" "ivan"   

> lapply(tsplit,function(x) x[1])

[[1]]
[1] "bob"

[[2]]
[1] "mary"

[[3]]
[1] "jose"

[[4]]
[1] "michael"

[[5]]
[1] "charlie"

> unlist(lapply(tsplit,function(x) x[1]))

[1] "bob"     "mary"    "jose"    "michael" "charlie"

Как избежать цикла в R: выбор элементов из списка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 10 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как избежать цикла в R: выбор элементов из списка

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 10 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы