Как отфильтровать уникальную комбинацию столбцов из фрейма данных R - PullRequest
23 голосов
/ 03 декабря 2011

Я пытаюсь отфильтровать дубликаты подмножества столбцов из кадра данных в R.

Я заинтересован в фильтрации уникальных комбинаций сеанса, первого и последнего.Вот как выглядят мои данные

                        session       first     last            city
1  9cf571c8faa67cad2aa9ff41f3a26e38     cat   biddix          fresno
2  e30f853d4e54604fd62858badb68113a   caleb     amos                
3  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
4  2ad41134cc285bcc06892fd68a471cd7  daniel  folkers                
5  63a5e839510a647c1ff3b8aed684c2a5 charles   pierce           flint
6  691df47f2df12f14f000f9a17d1cc40e       j    franz prescott+valley
7  691df47f2df12f14f000f9a17d1cc40e       j    franz prescott+valley
8  b3a1476aa37ae4b799495256324a8d3d  carrie mascorro            brea
9  bd9f1404b313415e7e7b8769376d2705    fred  morales       las+vegas
10 b50a610292803dc302f24ae507ea853a  aurora      lee                
11 fb74940e6feb0dc61a1b4d09fcbbcb37  andrew    price       yorkville

Ответы [ 2 ]

43 голосов
/ 03 декабря 2011

Следующие должны сделать это:

unique(df[,c('session','first','last')])

где df - ваш фрейм данных.

3 голосов
/ 15 декабря 2016

Пока не могу комментировать, но это ответ Climbs_lika_Spyder.

Вы можете получить уникальные значения, используя функцию подсчета библиотеки plyr

library('plyr')
A=rep(c('a','b'),4)
B=rep(c('c','d'),each=4)
df=data.frame(A,B)
count(df,vars = c('A','B'))
...