Фрейм данных таблиц из списка - PullRequest
2 голосов
/ 18 июля 2011

Предположим, у меня есть список с наблюдениями:

foo <- list(c("C", "E", "A", "F"), c("B", "D", "B", "A", "C"), c("B", 
"C", "C", "F", "A", "F"), c("D", "A", "A", "D", "D", "F", "B"
))

> foo
[[1]]
[1] "C" "E" "A" "F"

[[2]]
[1] "B" "D" "B" "A" "C"

[[3]]
[1] "B" "C" "C" "F" "A" "F"

[[4]]
[1] "D" "A" "A" "D" "D" "F" "B"

И вектор с каждым уникальным элементом:

vec <- LETTERS[1:6]

> vec
[1] "A" "B" "C" "D" "E" "F"

Я хочу получить фрейм данных с количеством каждого элементаvec в каждом элементе foo.Я могу сделать это с plyr очень некрасивым образом:

> ldply(foo,function(x)sapply(vec,function(y)sum(y==x)))
  A B C D E F
1 1 0 1 0 1 1
2 1 2 1 1 0 0
3 1 1 2 0 0 2
4 2 1 0 3 0 1

Но это, очевидно, медленно.Как это можно сделать быстрее?Я знаю о table(), но на самом деле не понял, как его использовать из-за 0-го числа в некоторых элементах foo.

Ответы [ 2 ]

5 голосов
/ 18 июля 2011

Одно решение (от макушки головы):

# convert foo to a list of factors
lfoo <- lapply(foo, factor, levels=LETTERS[1:6])
# apply table() to each list element
t(sapply(lfoo, table))
     A B C D E F
[1,] 1 0 1 0 1 1
[2,] 1 2 1 1 0 0
[3,] 1 1 2 0 0 2
[4,] 2 1 0 3 0 1
1 голос
/ 19 июля 2011

или с изменением формы:

cast(melt(foo), L1 ~ value, length)[-1]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...