Получение всех подмножеств в пределах фрейма данных и перечисление всех факторов в R - PullRequest
0 голосов
/ 01 июня 2018

Я столкнулся с проблемой в R, которая связана с подмножествами.Я должен составить список всех уникальных факторов в подмножестве в R, но я делал это через for loop .

Например, у меня есть кадр данных ниже:

       area         family    
 [1,] "Location 1" "Diaz"    
 [2,] "Location 1" "Santiago"
 [3,] "Location 2" "Peralta" 
 [4,] "Location 2" "Perez"   
 [5,] "Location 2" "Cooper"  
 [6,] "Location 3" "Tesla"   
 [7,] "Location 3" "Tatum"   
 [8,] "Location 4" "Brown"   
 [9,] "Location 4" "Lee"     
 [10,] "Location 4" "Anthony" 

Что мне нужно для вывода ниже:

[[1]]
[1] "Diaz" "Santiago"

[[2]]
[1] "Peralta" "Perez" "Cooper"

[[3]]
[1] "Tesla" "Tatum"

[[4]]
[1] "Brown" "Lee" "Anthony"

Может ли кто-нибудь помочь мне в упрощении этого процесса?

Спасибо.

Ответы [ 2 ]

0 голосов
/ 01 июня 2018

Дополнительно рассмотрим by:

by(df, df[, "area"], function(x) x[,"family"])
0 голосов
/ 01 июня 2018

Мы можем использовать split, чтобы разделить столбец 'family' по столбцу 'area' на list из vector s

split(df[,'family'], df[, 'area'])
...