Создать матрицу, используя общую информацию в двух списках - PullRequest
1 голос
/ 04 апреля 2019

У меня есть два больших списка в той же структуре примеров игрушек, показанных в этом вопросе.

dput (глава (песни1)):

list(FEB_GAMES = c(GAME1 = c("Stan", "Kenny", "Cartman", "Kyle", 
"Butters"), GAME2 = c("Kenny", "Cartman", "Kyle", "Butters")), 
MAR_GAMES = c(GAME3 = c("Stan", "Kenny", "Cartman", "Butters"
), GAME4 = c("Kenny", "Cartman", "Kyle", "Butters")))

dput (руководитель (песни2)):

list(first = c("Stan", "Kenny", "Cartman", "Kyle", "Butters", 
"Kenny", "Cartman", "Kyle", "Butters"), second = c("Stan", "Kenny", 
"Cartman", "Wendy", "Ike"), third = c("Randy", "Randy", "Randy", 
"Randy"))

Я хотел бы превратить эти два списка в один большой data.frame / matrix. Имена строк будут из списка1 (ИГРА1, ИГРА2, ИГРА3, ИГРА4). Имена столбцов будут именами списков 2 (первый, второй, третий). Информация в матрице будет целым числом, которое указывает на количество раз, когда общий символ найден в обоих списках. например GAME1xfirst содержит 9 общих символов, а GAME1xthird содержит 0.


Вывод будет выглядеть так:

        first  second  third
GAME1   9      3       0
GAME2   8      2       0
GAME3   8      3       0
GAME4   8      2       0

Таким образом, значения в [1,1] будут суммой, в которой общий символ будет найден как в списке GAME1 из списка 1, так и в первом списке, найденном в списке 2.

Примечание. Списки в списках 1 и 2 имеют различное количество значений.

Ответы [ 2 ]

2 голосов
/ 04 апреля 2019

Как насчет ...

sapply(l2, function(x) {
  sapply(unlist(l1, recursive = FALSE), function(y) sum(x %in% y))
})
#                 first second third
# FEB_games.GAME1     9      3     0
# FEB_games.GAME2     8      2     0
# MAR_games.GAME3     7      3     0
# MAR_games.GAME4     8      2     0

Может быть, не самый эффективный подход.

2 голосов
/ 04 апреля 2019

Можно было бы сначала сгладить 'list1', сделать merge после преобразования в data.frame, а затем сделать table

list1a <- do.call(c, list1)
names(list1a) <- sub(".*\\.", "", names(list1a))
out <- table(merge(stack(list1a), stack(list2), by = 'values')[-1])
names(dimnames(out)) <- NULL
out
#      first second third
#GAME1     9      3     0
#GAME2     8      2     0
#GAME3     7      3     0
#GAME4     8      2     0

Мы также можем сделать это в tidyverse, используя ту же логику

library(tidyverse)
list1 %>% 
    flatten %>% 
    enframe %>% 
    unnest %>% 
    full_join(list2 %>% 
                enframe %>%
                unnest, by = 'value') %>% 
    select(-value) %>% 
    count(name.x, name.y) %>% 
    spread(name.y, n, fill = 0) %>%
    filter(!is.na(name.x))
# A tibble: 4 x 4   
#  name.x first second third
#  <chr>  <dbl>  <dbl> <dbl>
#1 GAME1      9      3     0
#2 GAME2      8      2     0
#3 GAME3      7      3     0
#4 GAME4      8      2     0

данные

list1 <- list(FEB_games = list(GAME1 = c("Stan", "Kenny", "Cartman", "Kyle", 
"Butters"), GAME2 = c("Kenny", "Cartman", "Kyle", "Butters")), 
MAR_games = list(GAME3 = c("Stan", "Kenny", "Cartman", "Butters"
), GAME4 = c("Kenny", "Cartman", "Kyle", "Butters")))

list2 <- list(first = c("Stan", "Kenny", "Cartman", "Kyle", "Butters", 
 "Kenny", "Cartman", "Kyle", "Butters"), second = c("Stan", "Kenny", 
 "Cartman", "Wendy", "Ike"), third = c("Randy", "Randy", "Randy", 
"Randy"))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...